上月,Anthropic大力宣传其Mythos Preview模型所谓的突出网络安全威胁,并以此为由将该模型的初始发布范围限制在"关键行业合作伙伴"之内。然而,英国人工智能安全研究所(AISI)的最新研究显示,上周正式公开发布的OpenAI GPT-5.5,在网络安全评估中"达到了与Mythos Preview相近的性能水平",而AISI此前刚刚在上月完成了对Mythos Preview的评估。
自2023年以来,AISI持续对多款前沿AI模型进行测试,测试内容涵盖95项不同的"夺旗"(Capture the Flag)挑战,涉及逆向工程、网络漏洞利用和密码学等网络安全任务。在难度最高的"专家级"任务中,GPT-5.5的平均通过率为71.4%,略高于Mythos Preview的68.6%(两者在误差范围之内)。在一项特别复杂的任务中,该任务要求模型构建一个反汇编器以解码Rust二进制文件,AISI指出,"GPT-5.5在无需任何人工协助的情况下,仅用10分22秒便完成了挑战,API调用费用仅为1.73美元"。
在AISI设计用于模拟针对企业网络发动32步数据提取攻击的测试场景"最后幸存者"(TLO)中,GPT-5.5同样与Mythos Preview表现相当。GPT-5.5在10次尝试中成功3次,而Mythos Preview为10次中成功2次——此前从未有任何模型在该测试中哪怕成功过一次。不过,GPT-5.5在AISI难度更高的"冷却塔"测试中仍未能通关,该测试模拟的是对发电厂控制软件实施破坏的场景,迄今为止所有接受测试的AI模型均以失败告终。
这只是"恐惧营销"吗
AISI就GPT-5.5得出的新测试结果表明,就网络安全风险而言,Mythos Preview很可能并非"某一模型特有的突破性进展",而更像是"长期自主推理能力、逻辑推断能力和代码能力整体提升所带来的附带成果"。
在近期接受Core Memory播客采访时,OpenAI首席执行官山姆·奥特曼批评了部分AI模型在限制发布过程中所采用的"恐惧营销"手段。他表示自己"相信Mythos在网络安全方面是一款出色的模型",但同时补充道:"有人说'我们造了一枚炸弹,即将投向你的头顶,我们可以以1亿美元的价格卖给你一个防空掩体',这显然是极其高明的营销手法。"
奥特曼进一步表示:"未来会有越来越多关于'某些模型危险到无法发布'的论调出现,当然也确实会存在一些极为危险的模型,需要以不同方式加以发布。"
今年2月,OpenAI推出了"网络安全可信访问"试点项目,允许安全研究人员和企业验证身份并登记申请,以便将OpenAI的前沿模型用于"合规的防御性研究"。上月,OpenAI表示正在利用该可信访问名单,对GPT-5.4-Cyber进行限量发布——该模型变体据称"专门针对更强大的网络安全能力进行了微调,并放宽了部分能力限制"。
本周四,OpenAI首席执行官山姆·奥特曼在社交媒体上表示,GPT-5.5-Cyber的初期发布同样将采取限量策略,"将在未来几天内优先向关键网络防御人员开放"。
Q&A
Q1:AISI是如何评估GPT-5.5和Mythos Preview的网络安全能力的?
A:英国人工智能安全研究所(AISI)通过95项"夺旗"挑战对AI模型进行网络安全能力评测,内容涵盖逆向工程、网络漏洞利用和密码学等方向。在最高难度的"专家级"任务中,GPT-5.5平均通过率为71.4%,Mythos Preview为68.6%,两者在误差范围内基本持平。此外,AISI还使用"最后幸存者"和"冷却塔"两个场景进行模拟攻击测试,以评估模型在复杂真实网络安全场景中的实际表现。
Q2:山姆·奥特曼所说的"恐惧营销"具体是指什么?
A:奥特曼所说的"恐惧营销",是指部分AI公司在发布模型时,刻意强调模型的潜在危险性,以此制造舆论紧张感,并借机限制发布范围或推销相关安全服务。他以Mythos Preview为例,认为将某款模型渲染为"危险到必须限制访问"的做法,本质上是一种营销策略,而非真正出于安全考量。AISI的测试结果也在一定程度上支持了这一判断——GPT-5.5在公开发布的情况下取得了与Mythos Preview相近的表现。
Q3:GPT-5.5-Cyber和GPT-5.4-Cyber有什么区别?
A:GPT-5.4-Cyber是OpenAI专门针对网络安全场景进行微调的模型变体,在能力限制上有所放宽,并通过"网络安全可信访问"项目进行限量发布。GPT-5.5-Cyber则是在GPT-5.5基础上推出的同类变体,奥特曼表示其初期发布将同样采取限量策略,优先向关键网络防御人员开放。两款模型均面向具有合法防御需求的安全研究人员和企业,而非面向普通用户公开发布。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。