英伟达已不再仅仅是电脑显卡生产商。作为首个突破5万亿美元市值的公司,英伟达是AI领域的全球重要参与者。当确认发现两个影响Triton推理服务器的高危安全漏洞时,这就是一个重大事件。Triton推理服务器用于让AI应用程序与大语言模型通信、生成适当的响应并大规模部署AI模型。以下是关于CVE-2025-33211和CVE-2025-33201漏洞的相关信息,但要点很简单:立即更新。
英伟达发布Linux版Triton推理服务器安全更新
我通常偶尔报告影响英伟达GPU本身的安全问题,比如GPU内核驱动程序漏洞。我同样很少报告Linux安全问题,虽然这类问题时有发生。今天,我将关注一个同时涉及英伟达和Linux的安全公告。
英伟达将其Triton服务器描述为使组织能够在"任何处理器上运行来自任何框架的训练机器学习或深度学习模型"的推理服务,它是一个开源软件项目,"标准化了每个工作负载中AI模型的部署和执行"。这很酷。不太好的是,r25.10版本之前的所有Linux版英伟达Triton推理服务器用户都受到两个安全漏洞的影响,这些漏洞可能导致拒绝服务攻击以及对AI工作负载造成的所有后果。
这两个安全漏洞都被归类为高危漏洞,使用通用漏洞评分系统的评分为7.5分。我们所了解的详细信息如下:
CVE-2025-33211是一个不当验证问题,具体涉及"输入中指定数量"的问题,如果攻击者成功利用可能导致拒绝服务。
CVE-2025-33201如果被利用会产生相同的结果,但这次它使攻击者能够通过发送所谓的超大载荷来创建"对异常或特殊条件检查不当的问题"。
英伟达建议立即更新
英伟达警告说:"为保护您的系统,请从GitHub上的Triton推理服务器发布页面安装最新版本,并查看安全部署注意事项指南。"一如既往,如果您受到相关漏洞的影响,建议及时采取行动,确保您的AI部署不受安全问题影响。
Q&A
Q1:英伟达Triton推理服务器是什么?它有什么用途?
A:英伟达Triton推理服务器是一个开源软件项目,用于标准化AI模型的部署和执行。它使组织能够在任何处理器上运行来自任何框架的训练机器学习或深度学习模型,让AI应用程序与大语言模型通信、生成响应并大规模部署AI模型。
Q2:CVE-2025-33211和CVE-2025-33201这两个漏洞有多严重?
A:这两个安全漏洞都被归类为高危漏洞,使用通用漏洞评分系统的评分为7.5分。CVE-2025-33211是不当验证问题,CVE-2025-33201涉及对异常条件检查不当,两者都可能导致拒绝服务攻击,影响AI工作负载。
Q3:如何修复这些英伟达Triton服务器安全漏洞?
A:英伟达建议用户立即从GitHub上的Triton推理服务器发布页面安装最新版本r25.10或更高版本,并查看安全部署注意事项指南。所有使用r25.10版本之前的Linux版Triton推理服务器的用户都应及时更新。
好文章,需要你的鼓励
今年是AI智能体的爆发年。聊天机器人正演进为能代表用户执行任务的自主智能体,企业持续投资智能体平台。调研显示,超半数高管表示其组织已在使用AI智能体,88%在智能体上投入过半AI预算的公司已从至少一个用例中获得投资回报。Gartner预测,到2026年40%的企业软件应用将包含智能体AI,2035年智能体AI可能驱动约30%的企业应用软件收入。企业开始将AI智能体视为员工,建立招聘培训体系。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
谷歌的Nano Banana Pro AI模型生成的图像逼真度令人震惊,其关键在于完美模拟了手机相机的拍照特征。这些AI生成的图像具备手机拍照的典型特点:明亮平坦的曝光、较大的景深范围、略显粗糙的细节处理,甚至包含噪点。该模型还能自动添加符合情境的细节元素,如房产照片的水印等,使图像更加真实可信。这种技术进步意味着辨别AI生成内容变得更加困难。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。