让网络具备自我学习、自主运行、自我保护的特性近来成为网络大佬们致力于打造的新一代网络系统。“瞻博网络创新论坛”近日在北京召开,既然主题围绕“创新”,瞻博网络花了大量的篇幅去阐述未来网络愿景。
瞻博网络全球CEO Rami Rahim
一个自主运行的网络
瞻博网络全球CEO Rami Rahim在论坛开场主题演讲中用一个词表达了瞻博网络正在打造的新一代网络系统——“无人驾驶”。怎么去理解?无人驾驶汽车解放的是司机,使其在旅途中能够工作、阅读,甚至睡眠。瞻博网络要打造的网络可以视为解放的是IT运维人员,只需要很少甚至不需要人工干预,就能够进行网络自我配置、自我监控和自我维护,瞻博网络称它为“自主运行的网络(Self-Driving Network)”。
自主运行的网络将能够把网络操作人员从复杂的日常管理工作中解放出来,让他们把有限的资源运用于更重要的任务优化。
要实现自主运行的网络有几点要素,Rami Rahim在接受至顶网采访时表示,一是网络遥测技术,网络里需要采集非常多的数据和信息,比如关于当前网络运行状态的信息。所有网络的组成部分都需要能够提供这样的信息,瞻博网络的创新点就是能够把遥测技术的工作效率提高。
二是机器学习,机器学习将帮助我们从对网络静态编程,转向能够从数据输入中学习、做出预测,然后正确采取行动的算法,并且基于机器学习实现感应式网络响应。向训练算法中输入的数据越多,网络就越睿智。
三是要有能力在整个网络中做配置并进行安全方面的部署,让网络有自我调试的能力。“瞻博网络在此方面有实打实的产品提供,比如SDN的控制器,就是负责来为云网络提供相应的功能。”Rami Rahim说。
此外,还包括自动化和具有明确意图的编程等。
自主运行的网络具有预测能力,能适应环境变化。具体来说它可以自动发现其组成部分;自动配置;利用探测和其他技术自动监控;自动防御内部和外部威胁;自动纠错;自动检测是否需要新的服务,在需要时自动启用该服务;自动监测和更新服务,以优化服务交付;通过机器学习进行自动分析;定期或当出现意外状况时自动报告等。
SDSN——从“网络安全”到“安全网络”
作为一个网络创新者,瞻博网络还是一个重量级的安全厂商,不过如今它正在推动网络和安全融合,瞻博网络提出SDSN即软件定义安全网络的解决方案,将威胁从未知转化为已知,与云、防火墙、控制器、交换机一同协作,组成非常安全的网络。
SDSN倡导从“网络安全”到“安全网络”的转变。即让每一个点都有安全检测和执行能力,这里的每一个点,不仅限于网络节点,包括服务器、存储、PC、工作站、IP音视频,以及可能接入网络的所有智能终端等等。
在自主运行网络的驱动下,SDSN洞悉应该在什么时候以何种方式保护组织机构的人员、数据和基础设施的安全,并通过一个开放架构帮助简化组织机构的运营。瞻博网络SDSN平台及其相关生态系统能够帮助组织机构在异构网络中实现统一的安全策略,让企业能够简化产品集成和安全运营管理,且不受所选厂商的限制。
此外,瞻博网络针对其Junos Space Security Director Policy Enforcer推出了增强功能,扩大了这一生态系统,能够在整个网络中自动执行安全策略,在防火墙、瞻博网络交换机和第三方交换机中有效阻止安全威胁,这在业界尚属首次。同时也能够为网络各个层面提供安全保护,防御来自外部的威胁和横向的威胁。
Rami Rahim总结现如今瞻博网络创新的两个维度:一是提升网络扩展及性能。过去二十年瞻博网络一直延续着摩尔定律的方向进行发展,先纵向扩展,再横向发展;用底层设计的方式设计 SDN,以帮助克服摩尔定律放缓的趋势。二是网络自动化,通过自动化推动来满足更大的需求,同时也推动自己的服务能够更加的迅捷,让服务更快到达最终用户。另外瞻博网络也在不断提升成本效益,去管理大型复杂的设备和网络。
现在不论是自主运行的网络还是SDSN,都代表着瞻博网络的创新节奏。Rami Rahim指出,以瞻博网络目前大力推动研发的机器学习平台来说,它能够为网络以及云端服务提供更好的解决方案,帮助企业能够更好地利用网络里现有的资源,同时优化网络运营,保证云服务永不宕机。
在瞻博网络看来,这是一个“数字聚合”的时代,瞻博网络正在加速网络创新的步伐。同时,瞻博网络也在构建战略联盟,包括与联想、IBM等公司合作,以此完善解决方案,同时帮助自己扩大国内市场的机会。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。