在移动互联网、云计算、大数据等新技术推动下,国内数据中心产业飞速增长。在新一代数据中心建设的热潮中,各项新技术、新产品层出不穷。其中,一颗耀眼的新星近来频频获得大型企业及云数据中心提供商的青睐,这就是锐捷网络推出的新一代“牛顿”交换机——RG-N18018-X。该产品最大的特点,就是采用了“零背板”创新设计,实现了高密度、低损耗、绿色节能、平滑升级等一系列现代商业用户亟需的特性。
“零背板”技术刚刚问世时,其特性便让不少用户抛来了橄榄枝。但是,说到将这项技术应用到100T的交换平台上,并实现普及化,业界此前却一直存在着争论,这是因为,“零背板”有着极高的制造工艺等技术门槛,因此被认为商业化量产的难度很大。
那么,锐捷的研发人员又是如何迈过这个“高门槛”,打造出新一代的“牛顿”传奇呢?带着这个问题,我们采访了锐捷网络研究院的王兴国(化名),解密了“零背板”诞生背后的故事。
一颗脱落的铆钉
“零背板”,顾名思义,就是无背板技术,在数据中心交换机设备里不再设计背板这个部件。表面上看,虽说只是去掉了交换机的一个部分,但由于背板在原有交换机架构中的核心位置,这对于网络设备厂商生绝对是一次全新的考验。首先就是在缺少背板支撑的情况下,如何确保机箱结构坚固,否则,在运输和安装过程中,都会对设备产生大幅振动,若强度不够,就会导致板卡断裂等严重故障。
“振动测试是业内的通用标准,通常的做法是进行90分钟(X、Y、Z三个方向各30分钟)的振动实验,然后检测试验样品的包装,机械性能和电器性能。但由于没有了背板的支撑,我们特地用龙骨,加强筋等方法增加机箱强度。同时,在测试样品时,故意将时间延长到168小时,而就是在这多出来的166.5个小时里,我们发现有1颗铆钉断了。” 王兴国(化名)回顾了“零背板”新“牛顿”交换机在当初测试研发时的情况。那么,在几百颗铆钉中,为什么偏偏是这颗铆钉会被振断呢?
为此,锐捷网络研究院的工程师们搭建了极为复杂的机箱模型,对内外的所有铆钉进行应力仿真测试,又通过了无数个小时的调整优化、数以亿次的迭代计算,终于找到问题的根源。他们通过引入新型材料,并改良应力结构,使得应力可以均匀分摊,最终彻底地解决了该问题。改良后的机箱经过高出业界百倍时间的震动测试,整机无掉件、零件脱落、异响等情况,大大提升了系统的可靠性。
5厘米走线省下“一台大功率空调用电”
RG-N18018-X的单板支持36个100G接口,实现了单板3.6T的交换容量,整机最大提供576个100G端口或2304个25G端口,超过了同等尺寸设备接口密度的20%。如此高的性能,可以为用户业务提供更加轻松灵活的选择和应用支撑,不过同时也带来了新的技术挑战。
王兴国(化名)表示:“通常这种超高速信号设计,都要增加物理层芯片(PHY)进行信号加强。但这种常规设计会导致整机要增加1728W的功率,相当于1个大功率空调。而我们新一代“牛顿”交换价,主打的特性之一,就是绿色节能。为了把这一目标实现并落地,我们必须要为客户省掉这1728W的功耗!“
“通过反复模拟实验,我们发现必须让信号多走5厘米才能去掉这个耗能的物理层芯片。虽然5厘米是个看似很短的距离,但在超高速信号设计领域中确是很大的难关。”为了给用户交付一个绿色节能、性价比最高的产品,锐捷的工程师对几十种部件反复实验,最终选定了最佳的部件,并组合出一条特殊走线,赢得了这宝贵的5厘米,实现无PHY设计,节省了1728W的耗电量。
0.035毫米与5级定位
“CPU针脚弯了怎么办?”这是百度上非常常见的PC终端硬件技术问题,实际上,这一问题在交换机安装时也会存在。因为高性能需要更密的芯片针脚,而在“零背板”情况下,由于没有背板协助定位,这就对RG-N18018-X提出了前所未有的设计精度要求。否则,用户在安装设备和板卡升级时非常容易造成针脚变形,导致安装不到位、损坏甚至烧毁设备的故障。
为此,锐捷针对这款“零背板”交换机特别设计出了5级定位系统,但是机箱生产完成后,是否能满足高要求的设计指标呢?“由于板长将近1米,常规适用该长度的测量工具只能达到0.5毫米精度,远不能满足我们的精度要求。新‘牛顿’采用了精度高达0.035mm的3D扫描技术,彻底排除设计隐患“。王兴国(化名)介绍到,“另外,考虑到用户升级或安装时的一些误差,锐捷工程师还特意找到100名非专业人员参与测试,结果表明,只要在外壳对准之后,针面的角度可以保证连接器偏差2°范围内自动导入连接匹配状态,未受过专业训练的用户都能保障在无损的情况下完成安装。”
名牌大学生和“野蛮装卸员”
通过介绍可以看到,要具备“零背板”优势,成为新一代的“牛顿”,需要经历诸多考验。而类似的故事还有许许多多,除了殚精竭虑的思考,其中很多更需要“身体力行”。
“为了解决设备跌落可能导致的芯片焊球断裂的问题,同事们不但用软件仿真分析出了芯片的受力区域,摸清了跌落的重灾区,还需要进行大量的跌落实验。”王兴国(化名)说,很多人会经常看到一个小哥在锐捷研究院里面在摔包裹,举起来又扔下去,不断重复,常让路过的人以为是一个在野蛮装卸员在发泄心中不满,而实际上,他却是一位名牌大学毕业的优秀工程师。
新“牛顿”的诞生需要这种锤炼和摔打,企业的创新发展之路同样如是。正是这种“工匠精神“下的高标准、高要求,让锐捷的工程师们迈过了高门槛,造就了零背板技术,保障了产品品质。
好文章,需要你的鼓励
Turner & Townsend发布的2025年数据中心建设成本指数报告显示,AI工作负载激增正推动高密度液冷数据中心需求。四分之三的受访者已在从事AI数据中心项目,47%预计AI数据中心将在两年内占据一半以上工作负载。预计到2027年,AI优化设施可能占全球数据中心市场28%。53%受访者认为液冷技术将主导未来高密度项目。电力可用性成为开发商面临的首要约束,48%的受访者认为电网连接延迟是主要障碍。
MiroMind AI等机构联合研究团队提出了UniME-V2多模态嵌入学习新方法,通过让大型多模态语言模型充当"智能法官"来评估训练样本质量,解决了传统方法在负样本多样性和语义理解精度方面的问题。该方法引入软标签训练框架和困难负样本挖掘技术,在MMEB基准测试中取得显著性能提升,特别在组合式检索任务上表现出色,为多模态AI应用的准确性和用户体验改进提供了重要技术支撑。
亚马逊云服务宣布投资500亿美元,专门为美国政府构建AI高性能计算基础设施。该项目将新增1.3千兆瓦算力,扩大政府机构对AWS AI服务的访问,包括Amazon SageMaker、Amazon Bedrock和Claude聊天机器人等。预计2026年开工建设。AWS CEO表示此举将彻底改变联邦机构利用超级计算的方式,消除技术障碍,助力美国在AI时代保持领先地位。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。