8月10日消息,大中华区领先的电信中立网络服务提供商第一线集团欣然宣布,集团已成功通过其来自多家电信商建立稳定强大和全备援的网络骨干,于亚洲各主要数据中心之间建立超高规格运营商级别的网络连接。第一线确保其客户可利用前所未有的稳定网络基础设施,以较短时间开通第二及第三层网络服务组合,节省高达50%的成本。
第一线集团于上月在大中华区推出全新的万兆骨干环,以连接主要城市,包括:香港、北京、上海、广州及台北。这是继第一线的虚拟专用网络(VPN)与世纪互联的内容聚合互联主干网络(CCIB)业务单位合并后,成功将旗下的互联网及网络节点的数量增加至200多个,同时覆盖逾100个亚洲主要数据中心。
企业客户目前采用第一线的第二层网络服务组合,包括通过广域网(WAN)进行点对点连接的以太网虚拟专线(EVPL)服务、多点对多点以太网连接的虚拟专用局域网服务(VPLS)以及第三层网络服务 ─ 多协议标记转换的虚拟专用网络(MPLS VPN),可减省客户所在地与我们网络之间的网络连接成本,即本地电路成本。
此外,客户可利用第一线的第二层网络服务,更容易及有效地采用灾难修复及数据同步服务。
第一线集团创办人及行政总裁文立表示:“我非常高兴看到我们的优质服务组合在我们稳定强大的骨干基础设施上运作。由于早前我们已成功在大中华区推出 全新万兆骨干环连接主要城市,再加上集团在超过100个亚洲主要数据中心覆盖的200多个节点,客户就可轻而易举地通过EVPL、VPLS或MPLS VPN服务享受到超高规格运营商级别的网络连接,而且开通时间快速、品质优越,同时更可为他们节省最少30%至50%的成本。”
他补充道:“我们的网络运营中心(NOC)提供世界级监测及服务管理,确保服务质量及体验。我们将继续提高我们的服务品质,让客户持续获得独有非凡的用户体验”。
第一线现今在亚洲100多个主要数据中心运营超过200个互联网及网络节点。这些数据中心的运营商包括世纪互联、Equinix、NTT Communications、名气通电讯、万国数据、上海数讯、苏州国科数据中心、鹏博士电信传媒集团、富士通及Telehouse等。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。