AI 偏好控制：IETF 正在完善 robots.txt 以应对无视版权的 AI 爬虫

互联网工程任务组 (IETF) 成立了一个工作组，旨在制定新标准，让内容创作者能够向 AI 开发者表明是否允许使用其作品。该工作组将开发统一词汇表来表达作者和出版商对 AI 训练使用其内容的偏好，并探索将这些偏好附加到互联网内容的方法。这一举措源于当前系统的ineffectiveness，以及内容创作者对 AI 公司未经许可抓取内容的不满。

互联网工程任务组 (IETF) 已成立一个工作组，旨在制定一个标准，让内容创作者能够告知 AI 开发者是否允许使用他们的作品。

这个名为 AI 偏好工作组 (AIPREF) 的组织被要求开发两个方面的内容：

首先是制定一个通用词汇表，用于表达作者和发布者对其内容用于 AI 训练及相关任务的偏好；

其次是开发将这些词汇表附加到互联网内容的方法，可以通过将其嵌入内容中，或者采用类似 robots.txt 的格式，并建立一个标准机制来协调多个偏好表达。

AIPREF 章程建议通过"在内容元数据中包含偏好，或通过传递内容的协议发送偏好信号"来实现这些目标。

AIPREF 联合主席 Mark Nottingham 认为之所以需要这些措施，是因为当前的系统并不能很好地发挥作用。

他认为 robots.txt 文件中的"非标准信号"（这是一个 IETF 标准，用于定义爬虫是否允许访问网络内容的语法）已经失效。

"结果就是，作者和发布者对他们的偏好是否会被遵守失去了信心，只能采取诸如屏蔽 [AI 供应商] IP 地址的措施。"

内容创作者之所以采取 IP 屏蔽措施，是因为主要的模型开发商在抓取互联网内容用于训练 AI 时，并没有征求许可或寻求授权。

OpenAI 目前正在游说推动版权改革，希望能够在不付费的情况下抓取更多内容。

版权持有者正在通过起诉那些使用版权材料构建模型的机构进行反击，同时也在签署许可协议，让 AI 公司付费访问内容。

AI 爬虫还给发布者带来了经济负担。维基媒体基金会最近抱怨说，用于处理图像检索请求的带宽在过去一年增加了 50%，主要是因为 AI 爬虫下载资料。

IETF 并不关心这些法律和运营问题：它只想构建技术，让人们能够表达他们的偏好，希望爬虫运营者能够接受并只获取创作者愿意提供给 AI 使用的内容。

为了推进这项工作，AIPREF 在三月中旬的 IETF 122 会议上召开了会议，并已经制定了两个草案。一个提出了"用于自动处理的简短使用偏好字符串"，建议这些字符串可以用在 robots.txt 文件或 HTTP 头字段中。

另一个来自 Common Crawl Foundation 的提案题为"用于 AI 训练的内容偏好表达词汇"，同样建议将偏好语法存储在 robots.txt 文件或 HTTP 头字段中，还建议在元标签中使用proposed vocabulary。

AIPREF 本周正在召开会议，尽管一个计划中的会议似乎已被取消。

该工作组给自己设定了 2025 年 8 月的截止日期来提交提案。参与者似乎都知道这是一个紧迫的期限，因此该组织需要加快行动。

来源：The Register

0赞

好文章，需要你的鼓励

AI 偏好控制：IETF 正在完善 robots.txt 以应对无视版权的 AI 爬虫

来源：The Register

2025

04/10

11:27

分享

点赞

苹果在印度恢复银行卡支付功能，距暂停已逾四年

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

WordPress.com 推出免费的 AI 网站构建器

大型机在 AI 时代是否仍有一席之地？

Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

ChatGPT 获得记忆增强升级，让对话体验更进一步

AI 推理模型的兴起使基准测试成本大幅提升

Google 推出企业级 AI 智能体开发套件，助力快速原型开发和部署

Google 推出性能更快、更高效的 Gemini AI 模型

AI 时代的领导力变革：2035 年的 5 个关键启示

Google 推出第七代 Ironwood TPU 芯片，借助 AI 进行性能对比

xAI 公司推出 Grok 3 API 服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: