戴尔今天面向通信服务提供商推出了一系列新产品,旨在促进基于网络云的运营,简化分解网络云基础设施的部署、自动化和支持。
戴尔援引了数十年来与电信提供商合作的经验称,新的电信基础设施自动化套件(Telecom Infrastructure Automation Suite)旨在实现多厂商网络云基础设施的自动化协调和生命周期管理。它以开放标准和应用程序接口为基础,可以轻松集成到现有网络中,提高CSP在分布式、多供应商环境中部署和管理其所选基础设施的灵活性。
戴尔电信系统业务产品管理副总裁Andrew Vaz说:“所有主要运营商都在评估网络虚拟化,并进行概念验证或有限部署。”“等到电信运营商问的不是是否应该转型,而是如何转型的时候,我们就向前迈出了重要的一步。”
戴尔表示,该基础架构自动化套件可以利用声明式自动化,在服务器配置和供应方面节省数天或数周的时间,声明式自动化指定了想要的结果或目标,但没有明确定义实现这些结果或目标的具体步骤。
通过开放式应用程序接口和戴尔服务,基础架构发现和自动化可深入到网络基础架构层,支持与电信业务支持系统和运营支持系统的集成。遥测功能涵盖设备温度、CPU和内存利用率,当温度升高或内存使用率影响性能时,用户可以快速重新分配资源。
另一项重要公告是Dell Telecom Infrastructure Blocks for Red Hat,它将Dell PowerEdge XR8000 等戴尔服务器与红帽公司的OpenShift和Kubernetes 高级集群管理(Advanced Cluster Management for Kubernetes)相结合。
它支持在边缘运行的5G核心工作负载,以现有的5G核心和无线接入网络支持为基础,使CSP 能够从核心到边缘部署经过验证且一致的云平台。该软件包与电信基础设施自动化套件(Telecom Infrastructure Automation Suite)集成,用于管理和协调多供应商环境的基础设施。
意图驱动的协调
Vaz表示:“底层是计算、存储、(容器即服务)和网络服务。”“中间是一套服务,用于协调和管理这些功能。我们希望使其成为一个尽可能灵活并统一的系统。”意图驱动的协调来自于戴尔去年收购的Cloudify。
Vaz表示,该基础架构自动化套件“具有很强的可扩展性和API驱动,其(持续集成/持续部署)模型为AIOps奠定了基础”,AIOps是一门将人工智能与传统IT运营相结合的学科。他表示,一家早期客户部署了该套件,用于电源管理的闭环自动化,结果服务器利用率提高了 23%,资本支出减少了15%,总体拥有成本降低了20%。
该电信基础架构自动化套件将于 4月在全球上市,Telecom Infrastructure Blocks for Red Hat将于5月上市。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。