思科发布了一款新的路由ASIC芯片,旨在帮助数据中心运营商通过将现有数据中心连接成统一计算集群来克服电力和容量限制。
思科8223路由器突破性能新高
周三发布的思科8223是一款51.2 Tbps路由器,采用自研的Silicon One P200 ASIC芯片。结合800 Gbps相干光学技术,思科表示该平台可支持长达1000公里的连接距离。通过连接足够数量的路由器,思科称该架构理论上可实现每秒3艾比特的总带宽,足以连接目前最大的AI训练集群。
事实上,这样的网络能够支持包含数百万GPU的多站点部署,不过要达到这种带宽水平需要数千台路由器协同工作,成本不菲。对于不需要如此高速连接的客户,思科表示路由器可通过较小的双层网络支持高达13 Pbps的带宽。
云服务商积极评估新技术
这种高速跨数据中心网络的概念已经吸引了多家大型云服务提供商的关注,包括微软和阿里巴巴,思科透露他们正在评估这些芯片的潜在部署。
阿里云网络基础设施负责人Dennis Cai在声明中表示:"这种新的路由芯片将使我们能够扩展到核心网络,用P200驱动的设备集群取代传统的机箱式路由器。这一转变将显著提升我们DCI网络的稳定性、可靠性和可扩展性。"
行业竞争日趋激烈
思科只是跳上分布式数据中心潮流的最新网络设备供应商。今年早些时候,英伟达和博通也发布了各自的跨规模网络ASIC芯片。
与P200类似,博通的Jericho4是一款51.2 Tbps交换机,主要设计用于高速数据中心间网络结构。博通表示该芯片可以100 Pbps以上的速度连接相距100公里的数据中心。
英伟达也加入了这场竞争,在今年夏天的Hot Chips大会上展示了Spectrum-XGS交换机。虽然硬件细节仍然有限,但GPU数据中心运营商CoreWeave已承诺使用该技术将其数据中心连接成"单一统一超级计算机"。
技术挑战仍需克服
虽然这些交换和路由ASIC芯片可能帮助数据中心运营商克服电力和容量限制,但延迟仍然是一个持续挑战。
我们通常认为光速是瞬时的,但实际上并没有那么快。在相距1000公里的两个数据中心之间发送的数据包单程大约需要5毫秒才能到达目的地,这还没有考虑收发器、放大器和中继器等设备带来的额外延迟。
不过,谷歌DeepMind团队今年早些时候发布的研究显示,通过在训练期间压缩模型并战略性地调度两个数据中心之间的通信,可以克服许多这些挑战。
Q&A
Q1:思科8223路由器有什么特殊能力?
A:思科8223是一款51.2 Tbps路由器,采用自研Silicon One P200 ASIC芯片,结合800 Gbps相干光学技术,可支持长达1000公里的连接距离,能够将分散的数据中心整合成统一的AI训练集群。
Q2:跨数据中心网络连接面临什么技术挑战?
A:主要挑战是延迟问题。相距1000公里的数据中心间数据传输单程约需5毫秒,加上收发器、放大器等设备的额外延迟。不过谷歌研究显示可通过模型压缩和通信调度来缓解这些问题。
Q3:除了思科还有哪些公司在开发类似技术?
A:英伟达和博通也在开发跨规模网络ASIC芯片。博通的Jericho4可连接相距100公里的数据中心,英伟达展示了Spectrum-XGS交换机,CoreWeave已承诺使用该技术连接数据中心。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。