Cloudflare 推出"AI 迷宫"对抗网页爬虫机器人

Cloudflare 推出全新的 AI Labyrinth 工具，通过生成诱饵页面来对抗未经授权的网络爬虫。当检测到可疑爬虫行为时，系统会引导它们进入由 AI 生成的虚假页面网络中，消耗爬虫资源并降低其效率。这一创新方案为网站提供了比传统 robots.txt 更有效的数据保护机制。

Cloudflare，作为全球最大的互联网基础设施公司之一，近日宣布推出了一款名为"AI 迷宫"的新工具，用于对抗未经许可爬取网站数据用于 AI 训练的爬虫机器人。该公司在一篇博客文章中表示，当检测到"不当的机器人行为"时，这个免费的选择性工具会将爬虫引导至一系列 AI 生成的诱饵页面链接中，从而"减缓、混淆并浪费"这些恶意行为者的资源。

长期以来，网站一直使用基于信任机制的 robots.txt 文件来授予或拒绝爬虫的访问权限，但包括 Anthropic 和 Perplexity AI 在内的知名 AI 公司都被指控无视这一规则。Cloudflare 表示，他们每天要处理超过 500 亿次网络爬虫请求。尽管公司已经具备识别和阻止恶意爬虫的工具，但这往往会促使攻击者改变策略，形成"永无止境的军备竞赛"。

Cloudflare 表示，AI 迷宫不是简单地阻止机器人，而是通过让它们处理与网站实际数据无关的内容来进行反击。该公司称这也是"新一代蜜罐"，能够吸引 AI 爬虫不断深入追踪虚假页面的链接，而普通用户则不会这样做。这使得 Cloudflare 更容易将恶意机器人的特征录入黑名单，同时识别出原本无法发现的"新型机器人模式和特征"。根据博文介绍，这些链接对普通用户应该是不可见的。

您可以在 Cloudflare 的博客上了解更多关于 AI 迷宫的工作原理，以下是博文中的更多细节：

"我们发现，首先生成各种不同的主题，然后为每个主题创建内容，能够产生更加多样化和令人信服的结果。对我们来说，避免生成可能导致互联网上虚假信息传播的不准确内容非常重要，因此我们生成的内容都是真实的，并且与科学事实相关，只是与被爬取的网站内容无关且不具专有性。"

网站管理员可以通过进入其 Cloudflare 控制面板设置的机器人管理部分并开启相关功能来选择使用 AI 迷宫。该公司表示，这"只是利用生成式 AI 对抗机器人的第一步"。他们计划创建"完整的链接 URL 网络"，使陷入其中的机器人难以识别出这些内容是虚假的。正如 Ars Technica 所指出的，AI 迷宫与 Nepenthes 工具类似，后者旨在将爬虫困在 AI 生成的垃圾数据地狱中长达"数月之久"。

来源：The Verge

0赞

好文章，需要你的鼓励

Cloudflare 推出"AI 迷宫"对抗网页爬虫机器人

来源：The Verge

2025

03/25

10:31

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

Red Hat 简化 AI 应用训练和推理的数据访问流程

Groq 和 PlayAI 让 AI 语音更接近人类 — 这是他们的方法

OpenAI 爆火的吉卜力风格引发 AI 版权担忧

ETSI 发布首个后量子加密标准

Ingress-Nginx 漏洞使公开的 Kubernetes 集群面临被接管风险

ChatGPT 整合 GPT-4o 推出图像生成功能

让数据为 AI 做好准备的三个步骤

Imandra 新推出的 AI 编程助手 CodeLogician 利用"推理能力"确保代码准确性

微软为研究和数据分析推出"深度推理"版 Copilot AI

Amazon 推出 AI 智能购物助手，洞悉你的喜好

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: