AI 偏好控制：IETF 正在完善 robots.txt 以应对无视版权的 AI 爬虫

互联网工程任务组 (IETF) 成立了一个工作组，旨在制定新标准，让内容创作者能够向 AI 开发者表明是否允许使用其作品。该工作组将开发统一词汇表来表达作者和出版商对 AI 训练使用其内容的偏好，并探索将这些偏好附加到互联网内容的方法。这一举措源于当前系统的ineffectiveness，以及内容创作者对 AI 公司未经许可抓取内容的不满。

互联网工程任务组 (IETF) 已成立一个工作组，旨在制定一个标准，让内容创作者能够告知 AI 开发者是否允许使用他们的作品。

这个名为 AI 偏好工作组 (AIPREF) 的组织被要求开发两个方面的内容：

首先是制定一个通用词汇表，用于表达作者和发布者对其内容用于 AI 训练及相关任务的偏好；

其次是开发将这些词汇表附加到互联网内容的方法，可以通过将其嵌入内容中，或者采用类似 robots.txt 的格式，并建立一个标准机制来协调多个偏好表达。

AIPREF 章程建议通过"在内容元数据中包含偏好，或通过传递内容的协议发送偏好信号"来实现这些目标。

AIPREF 联合主席 Mark Nottingham 认为之所以需要这些措施，是因为当前的系统并不能很好地发挥作用。

他认为 robots.txt 文件中的"非标准信号"（这是一个 IETF 标准，用于定义爬虫是否允许访问网络内容的语法）已经失效。

"结果就是，作者和发布者对他们的偏好是否会被遵守失去了信心，只能采取诸如屏蔽 [AI 供应商] IP 地址的措施。"

内容创作者之所以采取 IP 屏蔽措施，是因为主要的模型开发商在抓取互联网内容用于训练 AI 时，并没有征求许可或寻求授权。

OpenAI 目前正在游说推动版权改革，希望能够在不付费的情况下抓取更多内容。

版权持有者正在通过起诉那些使用版权材料构建模型的机构进行反击，同时也在签署许可协议，让 AI 公司付费访问内容。

AI 爬虫还给发布者带来了经济负担。维基媒体基金会最近抱怨说，用于处理图像检索请求的带宽在过去一年增加了 50%，主要是因为 AI 爬虫下载资料。

IETF 并不关心这些法律和运营问题：它只想构建技术，让人们能够表达他们的偏好，希望爬虫运营者能够接受并只获取创作者愿意提供给 AI 使用的内容。

为了推进这项工作，AIPREF 在三月中旬的 IETF 122 会议上召开了会议，并已经制定了两个草案。一个提出了"用于自动处理的简短使用偏好字符串"，建议这些字符串可以用在 robots.txt 文件或 HTTP 头字段中。

另一个来自 Common Crawl Foundation 的提案题为"用于 AI 训练的内容偏好表达词汇"，同样建议将偏好语法存储在 robots.txt 文件或 HTTP 头字段中，还建议在元标签中使用proposed vocabulary。

AIPREF 本周正在召开会议，尽管一个计划中的会议似乎已被取消。

该工作组给自己设定了 2025 年 8 月的截止日期来提交提案。参与者似乎都知道这是一个紧迫的期限，因此该组织需要加快行动。

来源：The Register

0赞

好文章，需要你的鼓励

AI 偏好控制：IETF 正在完善 robots.txt 以应对无视版权的 AI 爬虫

来源：The Register

2025

04/10

11:27

分享

点赞

1976年大学实验如何催生美国风能产业

江波龙：建设完成mSSD月产能百万交付能力！mSSD高速存储介质赋能端侧AI规模应用

从IO500双榜第一，看国产存储的系统级突破

Rocket Lab宣布以80亿美元收购卫星运营商铱星公司

Tidal宣布将为AI生成音乐添加标签并移除欺诈内容

Claude Tag：将职场AI从个人助手升级为团队协作伙伴

数百万颗超新星爆炸或将揭开暗能量的秘密

Base44发布自研大语言模型，氛围编程平台寻求核心竞争壁垒

遗留系统与数据鸿沟制约亚洲财资中心发展

机器人手部公司与特斯拉达成商业秘密诉讼和解，完成1100万美元融资

OpenAI携手Trail of Bits发起"Patch the Planet"开源安全修复计划

想进大厂？初创公司或许才是你的最佳跳板

WordPress.com 推出免费的 AI 网站构建器

大型机在 AI 时代是否仍有一席之地？

Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

ChatGPT 获得记忆增强升级，让对话体验更进一步

AI 推理模型的兴起使基准测试成本大幅提升

Google 推出企业级 AI 智能体开发套件，助力快速原型开发和部署

Google 推出性能更快、更高效的 Gemini AI 模型

AI 时代的领导力变革：2035 年的 5 个关键启示

Google 推出第七代 Ironwood TPU 芯片，借助 AI 进行性能对比

xAI 公司推出 Grok 3 API 服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: