作者:Chang-Hong Wu,
VP Juniper Fellow, Networking Silicon Architect and Technologist
翻译: Shawn Zhang, Juniper Consulting System Engineer
穿越网络的每一位bit信息,在从源头到目的地的路径上,通常都要多次经过网络系统设备中的 ASIC 来交换实现。因此,ASIC 功耗和散热对于保持网络高效至关重要。 ASIC的高功耗和同时产生的高热量,需要复杂的电源和高容量的风扇来进行冷却,而这些风扇本身又有更大的功耗,使问题更加复杂。
多年来,半导体制程技术的改进一步一个脚印,进展顺利。正如戈登·摩尔(Gordon Moore)在著名的摩尔定律中所描述的那样,半导体技术大约每 18 个月左右改进两倍。如果某一代ASIC性价比太低、散热不理想,亦或不够快,您可以等待下一代制程的半导体技术,然后在技术浪潮中获得更快、更便宜、更低功耗的 ASIC来实现。在网络系统一代一代的迭代中,仍然需要做很多艰苦的工作,但您仍从新技术本身中受益很多。
这正是本世纪前十年及之前发生的事情。如图 1 所示,每一代的网络技术都通过以更高的时钟速度和更少的芯片数量来改进带宽、功能和功率。一个例子就是 ASIC 在这十年之初以 156MHz 开端,以大约 800MHz 终结,大概增加了 5 倍,但构成芯片组的 ASIC 数量却从 10 个减少到 2 个。这是一个“以速度为代表的时代”(Speed Era),我们通过更快的运行速度和更少的总硅面积实现了更高的带宽、更好的功能和更低的功耗。在2009年,瞻博网络在 MX 通用路由平台中引入了 Trio ASIC。这是一组非常灵活和可编程的 ASIC 和系统,在高性能的同时,基本上可以提供当时大部分网络的功能需求。
图1: Speed Era (以速度为代表的时代)
然而,在这十年的后几年,半导体改进的步伐显示出放缓的迹象。虽然随着每一代制程技术的发展,逻辑门的密度仍在增加,但工作电压的降低以及内在功耗的进步基本上都停止了。随着几何尺寸越来越小,晶体管的本征性能也没法在不影响功耗的前提下有很大的改进。这一趋势在接下来的几年中一直持续到 2010 年代。与此同时,随着视频业务的日益普及和运营商及OTT大型数据中心的出现,带宽的需求与日俱增,这对更高带宽和更节能的网络产品提出了更高需求。
在瞻博网络,我们注意到 ASIC 的片外访问(Off-Chip Accesses)正在成为实现高带宽的瓶颈,而且off-chip比on-chip连接消耗更多的功率。基于这种认识,我们推出了Express ASIC芯片和 PTX 核心路由平台。用一系列的新技术,包括虚拟输出队列(VoQ)和基于散列的最长前缀匹配查找(hash-based longest-prefix-match lookup ),我们将片外数据包缓冲区访问次数减少了一半,查找转发表访问减少了大约5倍。因此,通过优化这些特定网络应用平台,以及创新架构技术,我们在同一代的半导体技术中,将最终产品的功耗效率提高了大约两倍,如图2所示。
图2: SOC 时代
随着芯片到芯片之间带宽和互连的增加,互连所消耗的功率在整个芯片组功率中所占的比例越来越大。我们和业界同行合作,瞻博网络 ASIC 率先使用具有高速串行接口的 3D 存储器,从而将所有数据包转发、排队和接口功能集成到单个芯片中。在2010 年代的后半段,瞻博网络是最早采用“内封装高带宽内存 in-package HBM” 的网络供应商之一,更进一步,将多个slices和多个处理内核cores整合到同一个裸片上。这些创新技术,显著降低或去除了由于外部互联导致的高功率需求,同时也提升了带宽、降低能耗。这十年的进步主要体现在,虽然逻辑速度并没有太大的提高的同时,但在同一个芯片上集成了更多的功能。这就是为什么我将这十年称为“SOC 时代”或片上系统(System on a Chip)。
然而,使用“SOC 时代”的技术导致芯片尺寸越来越大。事实上,在这十年的尾端,很多的网络 ASIC 已接近现有半导体制造工艺可以容纳的最大尺寸。此外,在纳米级半导体制程中,杂质缺陷的出现是一种自然现象。一旦裸片尺寸达到一定阈值,从制程中获得无缺陷芯片的概率呈指数级下降,从而使良品的成本增加。显然,SOC 方法不可能永远持续下去。我们必须寻找更新的,可替代的方案。
近年来,该行业正在采用一种新方法,有时被称为“超越摩尔 More Than Moore”方法。这种方法,既不是在 PCB 上使用几个单独的 ASIC(从而增加芯片之间的互连功耗),也不是将所有都集成在一个芯片上(从而牺牲成本),而是将多个尺寸合理的芯片放在同一个封装内,每个芯片都用相对优化的制程工艺,实现本地的低功耗互连。这样即可以保持提升系统的功能和性能,又同时优化能源成本。这正可能是 2020年代的新解决方案。请参见图 3。
图 3: SiP(System in a Package)时代
瞻博网络将继续推出创新架构和集成技术,和我们的伙伴通力合作,并在这个新的“SiP(System in a Package)时代”提高产品的经济性和能效。
好文章,需要你的鼓励
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
NVIDIA联合多所大学开发的Omni-RGPT实现了AI视觉理解的重要突破,首次让AI能同时精准理解图像和视频中用户指定的任何区域。通过独创的Token Mark机制,该系统解决了传统方法在视频中容易"跟丢"目标的问题,在视觉问答、区域描述等多项任务上达到最先进水平,为教育、安防、内容创作等领域的AI应用奠定了基础。
Linux内核开发面临动荡时期,Rust语言引入引发摩擦,多名核心开发者相继离职。文章介绍了三个有趣的替代方案:Managarm是基于微内核的操作系统,支持运行Linux软件;Asterinas采用Rust语言开发,使用新型framekernel架构实现内核隔离;Xous同样基于Rust和微内核设计,已有实际硬件产品Precursor发布。这些项目证明了除Linux之外,还有许多令人兴奋的操作系统研发工作正在进行。
这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。