瞻博网络推出线卡模块,用以提升面向云和通信服务提供商的MX系列3D Universal Edge路由产品的整体性能。
推出新卡同时,瞻博网络这周也公开了其扩展套件(JET)的API,开扩展套件是Junos操作系统的应用程序开发平台。Junos是瞻博网络软件定义网络架构的关键组成部分。
瞻博网络计划在明年上半年为MX系列路由器推出三个线卡——MPC7、MPC8以及MPC9,计划在第一季度先为MX240和MX960路由器推出新卡。新卡提供每槽480Gbps吞吐量,用以10GbE和40GbE环境中。
MPC8和MPC9卡用于MX2010和MX2020路由器。前者提供每槽960Gbps吞吐量,后者能达到1.6Tbps吞吐量。MPC8和MPC9风别适用于10GbE、40GbE以及100GbE环境。
MX系列路由器的JET API
最新的JET API包括用于OpenConfig的一个,这是一个不关乎厂商的数据模型,用以配置和管理网络硬件和软件。一个非正式的网络运营商团体正着手于此项目。其成员包括谷歌、AT&T、British Telecommunications plc、微软、Facebook、Comcast以及Deutsche Telekom AG。
瞻博网络正瞄准第二个新的API,称作Junos Telemetry Interface,用于SDN和网络功能虚拟化部署。开发者可使用该接口从跑Junos的硬件中提取数据,以用于分析和管理应用程序。
该接口对于制造提升网络性能、管理、监控以及诊断产品的公司将尤为有用。已经在用的公司是SevOne Inc.。
根据IDC最新的以太网交换机和路由器市场报告,瞻博网络路由器在第三季度收入同比增长11%。其中20%的增长源自核心服务路由器。瞻博网络交换机收入上升了39.4%。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。