ZD至顶网网络频道 08月22日 编译:从改善的连接到技能培养,我们来详细看看奥运会主办城市里约热内卢以及整个巴西将在这个体育盛会之后保留下来的科技遗产。
通讯设施得以大规模改善
2016年里约奥运会有大约20%的预算用在了高科技基础设施上,其中很多是用于构建一个坚固的通信基础设施。尽管América Móvil的Clario是本次奥运会的官方运营商合作伙伴,但通信合作伙伴Embratel还是推出了一条用于奥运会主干网络的370千米长的光纤环,而思科带来了重达77吨的各种设备,另外所有本地移动运营商也都加强了他们的网络。
里约市的科学、技术及创新秘书Gustavo Tutuca在本周早些时候的一次活动中向记者表示,用于改善城市连接基础设施的投资最终将惠及市民大众,企业将利用改善的设施来提供更好的服务。
Tutuca补充说,公共管理也将受益,因为学校、医院以及其他机构都会因为奥运相关工作而获得互联网访问体验方面的改善。不过,他并没有具体说有多少组织机构因为新设施而受益。
大量租用设备或留在里约
据悉,思科为这次里约奥运会提供了大约1.5万台计算设备,里约市有机会利用这些设备服务于医疗或者教育等社会性项目中。而这批设备可享受临时的减免税待遇,并且在2016年底前都将租给里约奥委会使用。
在租用期之后,思科也许会选择将这批设备运回美国,或在交税之后继续留在巴西使用,亦或通过合适的项目捐赠给里约热内卢。期间,本地税务机关已经将2018年6月30日作为这批设备去留的最后期限。此外,奥委会采购的2000台PC也将在奥运会结束之后捐赠给里约市政府。
IBC将成为未来商务中心
位于奥林匹克公园巴拉达蒂茹卡心脏位置的国际广播中心(IBC)是NBC等广播公司临时的“家”,同时也是里约奥运会技术遗产的一部分。IBC是技术团队需要重点保障的地方,因为在这里产生的新闻、图片和视频内容将能够被全球超过40亿人看到。
据里约市政府称,他们希望把拥有领先科技基础设施(包含超高速互联网和可持续能源供应)的IBC转变成为商业中心。
智能城市项目
围绕着里约热内卢的Porto Maravilha港口和马乌阿广场,思科部署了一个覆盖10万平方米的WiFi网络。思科选择的15家初创公司所推出的智能城市技术,可以使用这个网络并用于奥运会项目当中。
其他的城市创新还包括物联网项目,例如NetSensors的物联网项目包含了安装在该区域28个沙井内的体积传感器。另外一个例子就是Audio Alerta的监控系统,它可以检测枪声和车祸等异常声音。这两种创新都被用在了Porto Maravilha的指挥和控制中心,并将在奥运会结束之后继续使用。
对技术人员的培养
在过去4年中致力于奥运会技术工作的8000人团队,也是里约市乃至整个巴西的一份重要资产。2016年里约奥运会CIO Elly Resende对此表示,“我们说的可是致力于技术的数千人,他们技能熟练,可以在关键任务环境中工作,在很多细分市场肯定也是大有用场的。”
此外,思科培训了大约300名年轻人运用到奥运会的相关工作中,其中100人致力于赛事中的网络支持服务。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。