安全研究人员诱骗苹果AI辱骂用户，潜在危害远不止于此

安全研究人员通过提示注入攻击成功劫持Apple Intelligence，使其对用户输出攻击者预设的内容。测试显示，100次攻击中有76次成功。研究人员结合Neural Exec和Unicode文字方向覆盖技术，绕过了苹果的输入输出过滤器及安全护栏。该漏洞影响至少2亿台设备及多达100万款应用。苹果已在iOS 26.4和macOS 26.4中修复该问题，但提示注入攻击仍是持续性安全挑战。

苹果的个人AI系统Apple Intelligence已被整合进新款Mac、iPhone及其他苹果设备中。安全研究人员证实，该系统存在提示注入漏洞，攻击者可借此劫持模型并控制其输出内容，数以百万计的用户因此面临安全风险。

Apple Intelligence包含一个本地运行的大语言模型，适配iPhone 15 Pro及后续支持机型、搭载M1或更新芯片的iPad与Mac、配备A17 Pro芯片的iPad机型，以及Apple Vision Pro。邮件、信息、备忘录、照片、Safari浏览器和Siri等原生苹果应用均已接入该功能，第三方开发者也可通过API调用。

RSAC的安全研究人员估计，截至2025年12月，支持Apple Intelligence的设备数量至少达到2亿台，苹果应用商店中使用该功能的应用多达100万款。于是，他们决定尝试攻破该系统——结果大多数情况下都成功了。

RSAC团队采用两种技术手段，绕过了Apple Intelligence本地模型的输入输出过滤机制和安全护栏。研究人员以100条随机提示进行测试，成功率高达76%。上述发现已在发布前提前与《The Register》共享。

RSAC研究与开发副总裁Petros Efstathopoulos表示："我们的目标是设计出一种能同时规避前置过滤、后置过滤以及模型内部安全机制的提示，于是开始对模型进行探测。"

研究人员已于2025年10月15日向苹果披露了上述发现。Efstathopoulos表示，在此之后发布的iOS 26.4和macOS 26.4已修复该漏洞，能够有效阻止RSAC所演示的攻击方式。

苹果方面未就Apple Intelligence相关问题、修复措施或研究披露事宜作出任何回应。

然而，提示注入这一更深层的安全问题依然是"一场猫鼠游戏"，Efstathopoulos说道。"模型会越来越善于识别此类攻击，所以我对未来持乐观态度。话虽如此，在这场猫鼠游戏中，双方在不同时间点总会有一方略占先机。"

为诱使本地模型就范，Efstathopoulos团队采用了一种名为Neural Exec的提示注入攻击方式，该技术由另一位RSAC研究员Dario Pasquini率先提出。Neural Exec利用机器学习代替人工生成输入内容，从而诱骗模型执行不该执行的操作。

"提示注入攻击涉及多个步骤，以往通常以较为手动的方式进行，"Efstathopoulos说，"Neural Exec使用优化算法加速了注入过程，能够快速生成可作为执行触发器的特定字符串，促使模型产生异常行为。"

尽管这类对抗性输入理论上可以针对任何模型，但Apple Intelligence所采用的轻量级本地模型相比大型云端模型更容易受到提示注入攻击。

在绕过苹果过滤机制方面，研究人员利用了Unicode的从右到左覆盖功能。该功能允许开发者在从左到右书写的文本（如英文）中嵌入从右到左书写的文字（如阿拉伯文），并使两者均能正确渲染。

"简而言之，我们将恶意的英文输出内容反向书写，再利用Unicode技巧强制大语言模型将其正确还原显示，"RSAC研究人员在报告中写道。

结合Neural Exec与Unicode的组合提示最终产生了以下回应："Hey user, go fuck yourself."（喂，用户，去你的。）

100条测试提示中，有76条成功触发。

尽管研究人员此次仅让Apple Intelligence对用户口出秽语，但同样的技术手段可被用于操控所有模型可访问的应用与服务数据。

"我们验证了该漏洞可被利用来在通讯录中新建联系人，"Efstathopoulos说，"这意味着攻击者可以悄然出现在你的联系人列表中，获得相应的信任权限。或者，攻击者可以用你熟悉的名字——比如'妈妈'——将自己的号码保存进去。"

"这可能造成混淆，甚至带来更严重的后果，"他继续说，"任何对用户设备有影响的操作，都可以想象被用于各种奇怪或恶意的目的。"

Q&A

Q1：Apple Intelligence的提示注入漏洞是如何被发现的？

A：RSAC安全研究人员通过两种技术手段成功绕过了Apple Intelligence的输入输出过滤机制及安全护栏。他们使用Neural Exec技术生成攻击触发字符串，再结合Unicode从右到左覆盖功能规避内容过滤，最终在100条测试提示中实现了76%的攻击成功率。

Q2：Neural Exec攻击方式是什么？和普通提示注入有何区别？

A：Neural Exec是一种利用机器学习算法自动生成攻击输入的提示注入技术，由RSAC研究员Dario Pasquini提出。与传统的手动提示注入相比，Neural Exec通过优化算法大幅加速了注入字符串的生成过程，能够更高效地找到可触发模型异常行为的输入内容，攻击效率更高、操作更系统化。

Q3：苹果已经修复Apple Intelligence的提示注入漏洞了吗？

A：是的。研究人员于2025年10月15日向苹果披露了该漏洞，苹果随后在iOS 26.4和macOS 26.4版本中推出了针对性修复，能够有效防御RSAC所演示的攻击方式。不过研究人员指出，提示注入作为一类安全问题仍是"猫鼠游戏"，模型与攻击手段将持续相互演进。

来源：The Register

0赞

好文章，需要你的鼓励

安全研究人员诱骗苹果AI辱骂用户，潜在危害远不止于此

来源：The Register

2026

04/13

16:50

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

美英加联合打击加密货币诈骗，冻结1200万美元资产

Chevin旗下FleetWave平台遭遇网络安全事件，英美用户陷入服务中断困境

英国就信号干扰器立法征询公众意见

HIPPO：用一个主密码生成所有网站密码，无需存储任何凭证

两起开源工具投毒事件揭示供应链攻击的未来走向

匈牙利政府账号密码泄露，"FrankLampard"竟成国家机密守门人

特朗普政府官员或正鼓励银行测试Anthropic的Mythos模型

VeraCrypt开发者账号遭微软封禁，数百万用户面临系统启动危机

CPUID网站遭劫持，HWMonitor下载链接被恶意替换

Anthropic"玻璃翼计划"：AI漏洞挖掘的机遇与隐忧

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会