OpenAI宣布推出一项新功能,该功能旨在为用户提供额外保护,以抵御提示注入攻击——一种将恶意指令隐藏在网页及其他内容来源中以操控聊天机器人行为的攻击手段。
锁定模式的主要功能
开启锁定模式后,系统将禁用多项功能,具体包括:实时网页浏览(用户仅可访问缓存内容)、从网络检索和展示图片(但仍可正常生成图片)、深度研究功能,以及智能体模式。
安全防护仍有局限
OpenAI坦言,即便开启锁定模式,ChatGPT仍可能面临提示注入风险。例如,攻击指令"可能出现在缓存网页内容或上传文件中,并可能影响响应的行为或准确性"。尽管如此,该功能的核心目标是降低敏感数据在使用过程中被泄露的可能性。
适用人群与推出计划
OpenAI明确表示,"锁定模式并非面向所有用户。它专为处理敏感数据、需要更严格防护以降低数据外泄风险的个人和组织而设计。"
目前,OpenAI正在向自助式ChatGPT商业账户及符合条件的个人账户逐步推出该功能。
Q&A
Q1:ChatGPT锁定模式具体会禁用哪些功能?
A:开启锁定模式后,ChatGPT将禁用实时网页浏览(仅可访问缓存内容)、从网络检索和展示图片(仍可生成图片)、深度研究功能以及智能体模式。这些限制的目的是减少外部内容与系统的交互,从而降低提示注入攻击导致敏感数据泄露的风险。
Q2:锁定模式能完全防止提示注入攻击吗?
A:不能完全防止。OpenAI明确说明,即使开启锁定模式,ChatGPT仍可能受到提示注入攻击的影响,例如攻击指令可能隐藏在缓存网页内容或用户上传的文件中,并对响应的行为或准确性产生影响。锁定模式的目标是降低敏感数据被泄露的可能性,而非提供绝对防护。
Q3:ChatGPT锁定模式面向哪些用户开放?
A:锁定模式目前正在向自助式ChatGPT商业账户以及符合条件的个人账户逐步推出。该功能主要面向需要处理敏感数据、希望获得更严格数据外泄防护的个人和组织,并不适用于所有普通用户。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。