物联网、5G和AR/VR等新兴技术的兴起,一直在驱动着边缘网络计算需求。但全球面临的新冠肺炎疫情,让高速网络的需求以一种前所未有的速度飞速增长——视频会议和流媒体内容播放的需求量均达到了创纪录的高度,两者都需要更高的带宽和零延迟数据传输。通常定义下,五毫秒以内的延迟都可以被认为是“零延迟”,但在当前全面联网的远程办公时代,五毫秒延迟也已经明显太慢了。
网络从未如此关键。无论是电话会议还是流媒体(视频内容或游戏),服务提供商都无法承受卡顿、分辨率下降和缓存变慢的现象。为了解决这一问题,业务应用和数据必须尽可能靠近数据摄取点,缩短总体往返时间,最终让应用程序可以实时获取信息。
但在实际执行中却不那么容易。
直面挑战
对于服务提供商来说,边缘计算有着独特的挑战。在边缘领域涌现出大量的解决方案意味着部署的容器越来越多,增长速度超过了人们可以实现有效管理的速度。虽然可以使用编排工具进行自动部署,但要确保自动化的故障排查和服务保证,可观测性才是关键。
毕竟,任何程度的服务中断都将会招致大量的客户投诉,因此服务提供商会迫使IT团队尽可能快速地解决问题。但从IT团队的角度来讲,即使已经拥有了识别问题来源和解决问题所需的信息,但检查分散于各服务器组件的大量遥测数据依然会是很大的挑战。IT团队需要能够快速地处理这些数据的能力,并根据可见的趋势获得有价值的洞察。
数据驱动的解决方案
解决方法的关键,就是在于人工智能的能力,更具体地说是机器学习,在其驱动下,编排解决方案可以对各工作负载进行可扩展的预测性操作。通过机器学习与实时网络监测的结合,可为自动化工具提供所需的洞察,从而以比人工更快更准确的方式对物理和虚拟网络功能进行预设、实例化并配置。这一过程也意味着IT团队可以把时间用在具有更高价值的任务关键型项目上,为企业创造实际收益。
将人工智能带到云端
针对应用程序在网络边缘的生命周期管理,机器学习也发挥着关键作用。在只有几个集中式数据中心构成的环境中,运营商可以明确应用程序虚拟网络功能(VNF)的最佳性能条件。但是随着环境分散成数千个小型场所,虚拟网络功能就有了更复杂的需求,必须根据实际情况予以满足。
运营商没有足够的带宽可以满足所有这些需求,因此人工智能的应用再次彰显出重要性。机器学习算法可以通过一个前期循环测试来运行所有组件,以评估它们在生产场所的表现,让运营人员判定所测试的应用程序可以在边缘正常运行。
由边缘网络决定的未来
边缘计算的兴起彻底改变了服务提供商对于基础设施的想法。人们越来越将边缘看作是优质资产。由服务提供商提供和管理,在人工智能和机器学习的优化下,边缘计算可被用于数不胜数的业务目的。一旦这一高度沉浸式边缘计算力得到释放,我们就会看到应用程序和新的工作负载涌向网络边缘,这在五年前还是无法想象的。
在未来,不只是服务提供商要利用网络边缘。很快,边缘云环境将会解放更多潜力——开放、安全、云原生,具有各种可扩展的预测性操作——可满足更丰富的企业、消费者和电信工作负载需求。边缘云将集成安全能力,有效减少安全事件的破坏半径。最终,人工智能驱动的预测性操作将会被用于管理运行着数千个边缘位置的复杂环境,从而有效提升消费者和员工使用体验。
好文章,需要你的鼓励
这项研究探讨了具身智能体(如机器人)如何通过记忆为用户提供个性化服务。宜远大学研究团队开发了MEMENTO评估框架,通过两阶段设计评估智能体利用记忆的能力。研究将个性化知识分为物体语义(如"我最喜欢的杯子")和用户模式(如"早餐习惯")两类。实验表明,即使是GPT-4o等前沿模型在需要综合多记忆的任务中也表现出30.5%的性能下降,特别是在理解用户模式方面存在明显挑战。
这项研究提出了一种创新的"生命长久安全对齐"框架,使大语言模型能够持续适应不断进化的越狱攻击策略。框架核心是元攻击者与防御者之间的对抗演化循环:元攻击者不断发现新的攻击策略,防御者则学习抵御这些攻击。实验表明,经过两轮迭代后,防御者成功将攻击成功率从73%降至7%,同时保持了模型的有用性。这种动态进化方法相比传统静态安全对齐更有效,为构建持续安全的大语言模型提供了新方向。
Enigmata是一项突破性研究,通过合成可验证的拼图训练大语言模型的逻辑推理能力。该研究创建了包含36种任务、7大类推理能力的完整训练系统,每项任务都配备了可控难度生成器和自动验证器。基于此训练的Qwen2.5-32B-Enigmata模型在拼图推理基准上超越了o3-mini-high和o1等顶尖模型。更令人惊喜的是,当应用于更大规模模型时,这些拼图数据不仅提升了模型解决拼图的能力,还意外增强了其数学和STEM推理能力,展示了纯逻辑训练带来的广泛泛化优势。
这项来自新加坡国立大学等机构的研究引入了REASONMAP,一个用于评估多模态大语言模型细粒度视觉理解能力的基准测试。研究团队使用来自13个国家30个城市的高分辨率交通地图,构建了1,008个问答对,设计了两级评估框架测量答案的正确性和质量。对15个流行模型的评估揭示了一个意外发现:开源领域的基础模型表现优于推理型模型,而闭源模型则相反。研究还表明,当视觉输入被遮盖时,模型性能普遍下降,证明真正的细粒度视觉推理任务仍需要有效整合多模态信息。