Cloudflare 推出"AI 迷宫"对抗网页爬虫机器人

Cloudflare 推出全新的 AI Labyrinth 工具，通过生成诱饵页面来对抗未经授权的网络爬虫。当检测到可疑爬虫行为时，系统会引导它们进入由 AI 生成的虚假页面网络中，消耗爬虫资源并降低其效率。这一创新方案为网站提供了比传统 robots.txt 更有效的数据保护机制。

Cloudflare，作为全球最大的互联网基础设施公司之一，近日宣布推出了一款名为"AI 迷宫"的新工具，用于对抗未经许可爬取网站数据用于 AI 训练的爬虫机器人。该公司在一篇博客文章中表示，当检测到"不当的机器人行为"时，这个免费的选择性工具会将爬虫引导至一系列 AI 生成的诱饵页面链接中，从而"减缓、混淆并浪费"这些恶意行为者的资源。

长期以来，网站一直使用基于信任机制的 robots.txt 文件来授予或拒绝爬虫的访问权限，但包括 Anthropic 和 Perplexity AI 在内的知名 AI 公司都被指控无视这一规则。Cloudflare 表示，他们每天要处理超过 500 亿次网络爬虫请求。尽管公司已经具备识别和阻止恶意爬虫的工具，但这往往会促使攻击者改变策略，形成"永无止境的军备竞赛"。

Cloudflare 表示，AI 迷宫不是简单地阻止机器人，而是通过让它们处理与网站实际数据无关的内容来进行反击。该公司称这也是"新一代蜜罐"，能够吸引 AI 爬虫不断深入追踪虚假页面的链接，而普通用户则不会这样做。这使得 Cloudflare 更容易将恶意机器人的特征录入黑名单，同时识别出原本无法发现的"新型机器人模式和特征"。根据博文介绍，这些链接对普通用户应该是不可见的。

您可以在 Cloudflare 的博客上了解更多关于 AI 迷宫的工作原理，以下是博文中的更多细节：

"我们发现，首先生成各种不同的主题，然后为每个主题创建内容，能够产生更加多样化和令人信服的结果。对我们来说，避免生成可能导致互联网上虚假信息传播的不准确内容非常重要，因此我们生成的内容都是真实的，并且与科学事实相关，只是与被爬取的网站内容无关且不具专有性。"

网站管理员可以通过进入其 Cloudflare 控制面板设置的机器人管理部分并开启相关功能来选择使用 AI 迷宫。该公司表示，这"只是利用生成式 AI 对抗机器人的第一步"。他们计划创建"完整的链接 URL 网络"，使陷入其中的机器人难以识别出这些内容是虚假的。正如 Ars Technica 所指出的，AI 迷宫与 Nepenthes 工具类似，后者旨在将爬虫困在 AI 生成的垃圾数据地狱中长达"数月之久"。

来源：The Verge

0赞

好文章，需要你的鼓励

Cloudflare 推出"AI 迷宫"对抗网页爬虫机器人

来源：The Verge

2025

03/25

10:31

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

Red Hat 简化 AI 应用训练和推理的数据访问流程

Groq 和 PlayAI 让 AI 语音更接近人类 — 这是他们的方法

OpenAI 爆火的吉卜力风格引发 AI 版权担忧

ETSI 发布首个后量子加密标准

Ingress-Nginx 漏洞使公开的 Kubernetes 集群面临被接管风险

ChatGPT 整合 GPT-4o 推出图像生成功能

让数据为 AI 做好准备的三个步骤

Imandra 新推出的 AI 编程助手 CodeLogician 利用"推理能力"确保代码准确性

微软为研究和数据分析推出"深度推理"版 Copilot AI

Amazon 推出 AI 智能购物助手，洞悉你的喜好

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: