英伟达近日修复了其Triton推理服务器中的三个漏洞,这些漏洞组合使用时,可让未经身份验证的远程攻击者完全控制服务器并在其上运行任意代码。
这些漏洞编号分别为CVE-2025-23319、CVE-2025-23320和CVE-2025-23334,是英伟达本周发布补丁修复的17个严重、中等和低严重级别漏洞的一部分。
这些漏洞增加了英伟达作为GPU和AI基础设施工具领先供应商,在其不断扩展的软件生态系统中最近必须解决的CVE清单,该清单相对较长且仍在增长。
Triton推理服务器是一个开源平台,负责处理模型推理任务。推理过程是接收用户输入数据,并通过使用TensorFlow、PyTorch和ONNX等深度学习框架构建的AI模型进行处理。
Q&A
Q1:Triton推理服务器是什么?主要用途是什么?
A:Triton推理服务器是英伟达开发的开源平台,主要负责处理模型推理任务。推理过程是接收用户输入数据,并通过使用TensorFlow、PyTorch和ONNX等深度学习框架构建的AI模型进行处理。
Q2:此次发现的漏洞有多严重?会造成什么影响?
A:此次发现的三个漏洞(CVE-2025-23319、CVE-2025-23320和CVE-2025-23334)组合使用时非常严重,可让未经身份验证的远程攻击者完全控制服务器并在其上运行任意代码。
Q3:英伟达这次总共修复了多少个安全漏洞?
A:英伟达本周发布补丁总共修复了17个安全漏洞,包括严重、中等和低严重级别的漏洞,其中三个关键漏洞可以组合利用完全控制服务器。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。