OpenAI于周五开始推出Codex Security,这是一个由人工智能驱动的安全智能体,旨在查找、验证漏洞并提出修复建议。
该功能目前以研究预览版的形式向ChatGPT Pro、企业版、商业版和教育版客户通过Codex网页版提供,下个月可免费使用。
OpenAI表示:"它能深入了解你的项目上下文,识别其他智能体工具遗漏的复杂漏洞,提供更高置信度的发现结果和修复方案,从而有效提升系统安全性,同时避免无关紧要的错误带来的干扰。"
Codex Security是Aardvark的演进版本。OpenAI于2025年10月以私有测试版形式推出Aardvark,帮助开发人员和安全团队大规模检测和修复安全漏洞。
在过去30天的测试期间,Codex Security扫描了外部代码库中超过120万次提交,识别出792个严重漏洞和10561个高危漏洞。这些漏洞涉及多个开源项目,包括OpenSSH、GnuTLS、GOGS、Thorium、libssh、PHP和Chromium等。部分漏洞列举如下:
GnuPG - CVE-2026-24881、CVE-2026-24882
GnuTLS - CVE-2025-32988、CVE-2025-32989
GOGS - CVE-2025-64175、CVE-2026-25242
Thorium - CVE-2025-35430、CVE-2025-35431、CVE-2025-35432、CVE-2025-35433、CVE-2025-35434、CVE-2025-35435、CVE-2025-35436
据这家AI公司介绍,应用安全智能体的最新版本利用了其前沿模型的推理能力,并结合自动化验证来最大限度降低误报风险,提供可操作的修复方案。
OpenAI对同一代码库的多次扫描显示出精确度不断提高,误报率持续下降,所有代码库的误报率下降了50%以上。
OpenAI在向The Hacker News分享的声明中表示,Codex Security旨在通过将漏洞发现建立在系统上下文基础上,并在向用户展示之前验证发现结果,从而提高信噪比。
具体而言,该智能体分三个步骤工作:首先分析代码库,掌握项目与安全相关的系统结构,并生成可编辑的威胁模型,捕捉系统功能和最易受攻击的位置。
系统上下文构建完成后,Codex Security以此为基础识别漏洞,并根据实际影响对发现结果进行分类。标记的问题会在沙箱环境中进行压力测试以验证其真实性。
OpenAI表示:"当Codex Security配置了针对你项目定制的环境时,它可以直接在运行系统的上下文中验证潜在问题。这种更深层次的验证可以进一步减少误报,并能够创建可工作的概念验证,为安全团队提供更有力的证据和更清晰的修复路径。"
最后阶段,智能体会提出与系统行为最匹配的修复方案,以减少回归问题,使其更易于审查和部署。
Codex Security的发布距离Anthropic推出Claude Code Security仅数周时间,后者同样帮助用户扫描软件代码库中的漏洞并提出补丁建议。
Q&A
Q1:OpenAI Codex Security是什么?它有什么功能?
A:Codex Security是OpenAI推出的人工智能驱动的安全智能体,专门用于查找、验证代码漏洞并提出修复建议。它能深入分析项目上下文,识别复杂漏洞,提供高置信度的发现结果和修复方案,有效提升系统安全性。
Q2:Codex Security在测试期间发现了多少漏洞?
A:在过去30天的测试期间,Codex Security扫描了超过120万次代码提交,识别出792个严重漏洞和10561个高危漏洞。这些漏洞涉及OpenSSH、GnuTLS、GOGS、Thorium、PHP、Chromium等多个知名开源项目。
Q3:Codex Security是如何工作的?
A:Codex Security分三步工作:首先分析代码库并生成威胁模型,掌握系统结构和易受攻击位置;然后基于系统上下文识别漏洞并分类,在沙箱环境中验证问题真实性;最后提出与系统行为匹配的修复方案,减少回归问题。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。