ZDNET网络频道 07月22日 编译:据之前消息称,思科公司的小型蜂窝网络业务正陷入困境。如今相关报道正不断涌现,消息宣称思科最近的另一项收购活动也遭到阻碍。
根据上周的报道,Ubiquisys公司斯温顿运营总部内的半数员工都可能被遣散,Lightreading网站认为如今思科在收购Intucell公司时也遇到了重重阻碍。
Intuicell公司的主要卖点在于其SON(即自优化网络)技术。这项技术能够对移动基站流量数据进行筛查,并通过分析对相关参数进行调整,例如根据流量模式的变化对蜂窝传输能力加以变更。
Lightreading网站宣称,思科公司将把目前旗下的一系列业务部门共同划归至无线接入网络(简称RAN)事务部当中。
正如此前以3.1亿美元收购Ubiquisys公司所获得的小型蜂窝数据业务,思科此次亦需要以4.75亿美元的价码买下Intuicell来招揽其RAN业务。
Lightreading网站同时指出,尽管思科公司也拥有自己的小型蜂窝数据产品,但在本届移动世界大会上、网络巨头仍然宣称其将负责销售来自SpiderCloud公司的同类产品,也就是USC 8000产品线。与此同时,思科也在会上公布了其与沃达丰之间达成的一项重要部署协议。
根据我们掌握的消息,思科之所以会将SpiderCloud纳入到自家产品线支持清单当中,主要是因为Ubiquisys并没能顺利从原本的初创模式转移至“运营模式”。
就在本月早些时候,思科公司曾承诺在英国进行高达10亿美元,折合6.45亿英镑的巨额投资。
尽管这项发展战略受到了英国首相David Cameron的热烈欢迎,但被过分强调的Ubiquisys却没办法这么乐观。虽然该公司的投资方及创办者能够通过收购获得丰厚的回报,但如果是单纯将其知识产权拿走、并把研发机构转移到加利福尼亚州,那么英国又能迎来什么样的后续收益呢?
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。