数据中心网络下一轮的疯狂升级将是400Gbps以太网,瞻博网络(Juniper Networks)日前也推出自己的路线图。
今年可算是400 Gbps公告年,Arista 曾与2月份发消息指预计将从明年开始推出旗下400Gbps套件的试用部署,而Mellanox和Marvell Semiconductor则曾宣布在努力发展400Gbps芯片。
但这也并未令瞻博网络落在后面:在通用400Gbps未被广泛采用之前仍有足够的时间赢取客户,而且业界一般都认为100Gbps和400Gbps将出现重叠。
瞻博网络的路线图涵盖IP传输路由、数据中心交换机和广域网服务路由器。
瞻博400Gbps计划背后的引擎是瞻博2018年6月宣布推出一款名为Penta的芯片,Penta是一个16nm数据包转发引擎,每0.5瓦的速度为每秒千兆位,比Penta芯片前身的Junos Trio芯片组高50%。 Penta嵌入了MACsec和IPsec加密,支持光网络论坛(Optical Network Forum)的FlexE协议,FlexE协议可提供链路绑定和信道化。
瞻博网络在周二的公告里表示将生产用于400Gbps过渡的新一代ExpressPlus和Q5芯片。
新一代ExpressPlus和Q5芯片会在三种产品中首先出现:
· 三机架单元路由器PTX10003数据包传输路由器:含160个速度为100Gbps 的MACsec接口,支持速度为400Gbps的32个接口的FlexE,含通用的多速率QSFP-DD(四核小型 - 双密度)模块。 PTX10003预计可在今年下半年发货。
· QFX数据中心功能将从今年下半年及 2019年上半年开始提供400Gbps支持。另外,基于新Q5芯片的32 x 400Gbps 3RU交换机QFX10003的容量将可达160 个 100Gbps接口;而单机架单元QFX5220交换机则配有32 个 400Gbps接口,支持50Gbps和100Gbps连接。
· 6月宣布推出的MX系列路由平台将配备Penta线卡,因而可在MX960、MX480和MX240型号上走400Gbps以太网。
常务副总裁及首席产品官Manoj Leelanivas在博文里提到,100Gbps的尾巴将于2021年底遭遇不断增加的400Gbps端口产品,他预计届时40Gbps将会减少。
Leelanivas表示,400Gbps套件会导致时下2 x 50Gbps典型服务器连接价格的下降,并且已经在朝2 x 100Gbps 迁移,“超过了过去十年里11%的同比增长率”。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。