ZDNET网络频道 06月03日 编译:惠普与快速增长的网络供应商Arista Networks建立合作伙伴关系,以期为开放融合基础设施提供更多的选择。合作伙伴称,二者结合的目的主要是针对竞争对手思科。
据惠普发布的资料显示,两家公司会将Arista的网络设备与惠普的3Par服务器技术、存储设备和网络管理软件OneView结合在一起。
Versatile Communications是一家总部设在美国马萨诸塞州Marlborough的网络解决方案提供商,是惠普合作伙伴。该公司首席执行官及共同创始人John Barker表示,“显然,此举将影响到思科。Arista与许多别的网络上不同,相对思科而言,Arista的成功转化率颇令人欣慰。即便是铁杆思科客户也认为Arista转型之路甚为简单,说到底,Arista的根是两位思科前高管和工程。”
Jayshree Ullal在成为Arista的CEO兼总裁之前曾经营过思科的数据中心、交换和服务集团。两间公司的过节还不仅仅在此。思科曾两度针对Arista提出法律诉讼,称总部位于美国加州圣克拉拉厂商Arista侵犯了很多思科专利及窃取了思科版权资料。
合作伙伴表示,Arista在软件定义网络方面的专业知识对惠普渠道合作伙伴来说是一个巨大的优势。市场研究公司Gartner本月发布报告称,Arista网络和思科是数据中心网络的领头人,Gartner报告指,Arista在该领域里“显然是增长最快的”的供应商。
Focus Technology Solutions是一家总部设在美国新罕布什尔州Seabrook的思科和惠普合作伙伴。该公司的首席技术官Bill Smeltzer表示,“Arista被认为是软件定义网络的领导者,因此惠普利用Arista可以更好地与思科的ACI、博科SDN和VMware的NSX产品竞争。对于那些早期SDN采纳者及Arista网络方面的客户来说,惠普此举可为他们提供接近惠普计算和存储的机会。”
惠普表示,新的解决方案旨在提供私有云、公有云和混合云应用程序的支持,同时可以跨计算、跨存储地进行灵活开放的选择。合作伙伴表示,Arista的高性能交换技术与3Par及惠普服务器结合是“强强联手”,对此,渠道合作伙伴可以在自己的客户账户上找到定位。
Matrix Integration是总部设在美国印第安那州的Arista、惠普和思科合作伙伴。据该公司业务开发经理Shannon Champion的介绍,对于Arista合作伙伴来说,惠普-Arista伙伴关系为他们打开了大门,提供了接触大量的惠普客户群的机会。
Champion 表示,“此举的意义重大,而且是可行的。Arista有一些很妙的产品,他们的愿景很棒,合作伙伴对他们的利润率也颇感兴趣。”
Smeltzer表示,惠普合作伙伴还可以“玩两手准备”,意指惠普的白标交换产品。
Smeltzer称,“如果客户希望使用VMware的NSX,或是某种类型的OpenStack SDN,他们现在有白盒交换设备可用,但如果客户找的是可以立即启用、现成的商业级SDN,他们也可以做出反击并对自己说,‘对,这地方可以用上Arista产品。’”
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。