思科曾于2019年年底宣布将进军商联网芯片业务,当时也在网络上掀起了一波浪潮。思科的商联网硅新平台是一款统一的可编程网络ASIC,名为Cisco Silicon One(思科芯一号),Silicon One在许多维度上都是行业的首次,而在笔者看来,2019年思科发布Silicon One的消息至少是五年来最重要的公告。因为笔者在芯片领域及相关领域也工作了30多年了。
目前的互联网基础架构大多都无法应付VRAR、AI、5G、10G、16K流媒体、自适应网络安全、量子计算等应用所要求的东西。Silicon One是思科解决这一问题的方案。Silicon One的普遍适应性和可编程性旨在为服务提供商和大规模网络细分市场,以及固定和模块化平台的需求提供支持。
思科之后于2020年10月推出首批六款含新芯片Silicon One的设备,将原本专注路由的思科Silicon One平台扩展成同时支持大规模网络交换的平台。两周前,思科又不张旗鼓地宣布推出三款基于Silicon One的新设备。所有这些都是在Silicon One平台正式推出后仅仅15个月的时间里完成的,这节奏令人印象深刻。下面来看看这三款新芯片及其特点。
Cisco Silicon One 示意图 (图:思科)
周全的Silicon One系列
思科本次公布的明星产品是全新的Silicon One G100。该款网络交换设备是业界首款具7nm、25.6Tbps功能、可编程和完全共享的包缓冲设备。思科表示,该款新产品巩固了思科作为市场上拥有最高带宽路由和交换芯片的供应商地位。
G100配有业界首个1.6Tbps接口,速度方面傲视群芳,是目前领先的400GE接口速度的四倍以上。据思科说,这样的速度可以令客户以前所未有的方式扩展自己的网络。G100另一个很酷的地方是其包引擎,G100的包引擎可以将整个1.6Tbps接口用于单一流量的处理。
思科还称该设备具有全面可编程性,并列出了各种可编程性用例,例如解析、处理、时间戳、计数器、仪表、直方图、水印和流量分析等等。根据思科的说法,这些功能可以令客户以纳秒级的粒度重放和回看过去的攻击,从而找出问题出在哪里,进而进行相应的优化。
此外,思科还提到客户可以构建32-800G无Retimer的1RU系统,在机架内无需禁用无源直接附件铜缆(Direct Attach Copper cables),从而可以提高网络效率。那些希望开发大规模扩展网络的客户可以获益,因为每个SerDes都提供了以太网媒体访问控制(Media Access Control)。因此其架构可以扩展成256x100GE。而所有这一切都是在只用了一个芯片的情况下实现的。
其他两款产品虽然在宣布推出时没有那么隆重,但看起来其实是10月份宣布推出的第一批设备阵容的坚实补充。Q211L加入了兄弟Q2系列(12.8Tbps Q200L、6.4Tbps Q201L、3.2Tbps Q202L leaf及TOR(机架顶部)交换机)。Q211L的速度为8Tbps,含内置7nm与160x56G PAM4 SerDes。思科表示,客户可以利用这样的配置构建优化的40x200GE 1RU系统。Q211L提供了大规模表和网络地址转换(NAT),以及端口地址转换(PAT)等高级SmartTOR功能,力图简化网络设计。Q211L还配备了运行到完成的P4处理器、先进的分层流量管理器和分层等成本多路径(ECMP)引擎。
最后要说的Cisco Silicon One Q211则加入了思科的Q200、Q201和Q203路由设备系列。Q211的速度与Q211L一样都是8Tbps,Q211特配了内置7nm与160x56G PAM4 SerDes。客户可以利用这些功能开发具有10GE到400GE端口混合的优化固定系统。Q211基本上拥有Q211L的大部分长处,但由于拥有更大的表规模和深层数据包缓冲器而高了一个档次。
总结
笔者认为思科在15个月的时间里已经从最初的起步,悄然成了路由和大规模网络交换芯片领域的领导者,这可不是件简单的事情。三款新设备看起来是对思科Silicon One的宝贵补充,思科在将路由和大规模网络交换芯片的融合方面起到了引领作用,这无论对思科还是对整个行业都是一件好事。
好文章,需要你的鼓励
是德科技高级副总裁兼通信解决方案事业部总裁Kailash Narayanan现场指出,算力固然重要,但如果能耗过高,技术的实用性将大打折扣,因此,所有的高速、高性能计算,都必须在极低的功耗下实现,这是AI等技术能否大规模落地的核心前提。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。