大语言模型防火墙是 AI 安全的未来吗？

随着大型语言模型（LLMs）在各行业广泛应用，保护这些强大AI工具的安全性日益受到关注。专家们探讨了LLM防火墙是否能解决AI安全问题，或仅是安全体系中的一环。专家们认为，LLM防火墙不仅能确保AI安全，还能防止模型产生偏见和有害输出。他们强调了定制化、多层防御和跨学科团队的重要性，并指出LLM防火墙将随着AI技术的发展而不断演进。

随着大语言模型 (LLM) 在各行业得到更广泛的应用，确保这些强大 AI 工具的安全性已成为一个日益增长的关切。本周在新加坡举行的 Black Hat Asia 2025 大会上，一组专家深入探讨了 LLM 防火墙是否是 AI 安全的解决方案，还是仅仅是整个安全体系中的一部分。

网络安全公司 CloudsineAI 的创始人 Matthias Chin 首先指出了防护机制和防火墙之间的区别："防护机制是一种保护机制，而防火墙是一个具有更多功能的安全概念 - 例如，它是一个控制点，包含防护机制，拥有威胁向量数据库，并可以与 SIEM (安全信息和事件管理) 工作流程集成。"

新加坡内政团队科技局 (HTX) 首席创新官兼首席云工程师 Pan Yong Ng 指出，将 AI 安全整合到组织 IT 基础设施的基础中非常重要，尽管对于安全控制应该放在哪里仍存在不确定性。他建议在各个层面实施组合控制，从推理服务模型到 Web 应用程序安全，甚至扩展到 AI 代理。

AI Singapore 的 AI 创新总监 Laurence Liew 表示，开发人员对 AI 代理和大语言模型的使用日益增加，这将需要使用 LLM 防火墙来执行防护机制和企业政策。他说："我们告诉年轻工程师要确保设置某些防护机制，他们会去做，但他们经常忙于编码，以至于防护机制可能没有得到更新。"

新加坡南洋理工大学研究员 Xiaojun Jia 指出了传统防火墙在解决 LLM 特定安全问题方面的局限性。他说："传统防火墙专注于网络安全，这使得它们在防御利用 LLM 逻辑流程的越狱攻击方面效果不佳。"

Chin 补充说，LLM 防火墙不仅仅是为了确保 AI 安全 - 它们也用于 AI 安全性，以防止模型幻觉和产生有偏见和有害的输出。它们还可以防范通过人类语言和提示而不是代码执行的新一代攻击。

专家组还探讨了通用 LLM 防火墙是否能够在所有行业中有效运作，还是需要定制化的问题。

Liew 特别提到了 AI Singapore 与政府机构的转录项目，其中语音转文本引擎根据每个机构的需求进行了微调。他说，同样地，LLM 防火墙应该经过精心设计，以处理医疗保健和金融服务等特定场景。

在实施 LLM 防火墙方面，Jia 提倡采用包括输入检测、模型调优和输出过滤的多层次方法。

"输入检测在提示输入模型之前检测恶意输入，模型调优确保输出与人类价值观一致，输出过滤检测有害输出，"Jia 说，同时他也承认在安全性和可用性之间取得平衡是一个挑战，呼吁采用能够应对不断演变的攻击的自适应防御措施。

测试和基准测试对于确保 LLM 及其防火墙按预期工作至关重要。Chin 表示这个领域仍在发展中，需要完成的工作将取决于测试用例，并与防火墙将部署的行业（无论是银行还是医疗保健）保持一致。他指出 Meta 的 CyberSecEval 和新加坡的 AI Verify 是可以帮助支持测试和基准测试工作的示例。

Liew 强调了在构建和测试 LLM 时拥有多元化团队的重要性。他说："拥有跨不同学科的人才非常重要。确保团队中有了解领域的人。你会惊讶地发现，他们提出的问题是网络安全工程师从未想到的。"

关于 LLM 防火墙是否会阻碍 AI 创新，Chin 表示，随着模型上下文协议 (MCP) 等新兴技术的采用 - 这是 Anthropic 开发的一个开放标准，允许 AI 代理与其他应用程序和数据源通信 - AI 代理可能会绕过 LLM 防火墙并开始与其他代理通信。他补充说："我们必须让创新蓬勃发展，并继续建立应对挑战的敏捷性。"

Chin 表示，LLM 防火墙将继续发展，这是由代理式 AI 框架的兴起推动的，组织，特别是大型企业和政府，将需要某种形式的防护机制或防火墙。就像网络防火墙现在包括 Web 应用防火墙和终端防火墙一样，他指出 LLM 防火墙可以采用部署在安全控制点和终端的硬件或软件形式。

来源：Computer Weekly

0赞

好文章，需要你的鼓励

大语言模型防火墙是 AI 安全的未来吗？

来源：Computer Weekly

2025

04/07

11:49

分享

点赞

REDMI Note 15 Pro+发布，同档最抗摔的实战之王，首销 1899元起

数学AI也会"装懂"？四川大学研究团队揭示AI缺失的核心能力

挪威人形机器人公司1X CEO：我们的产品先进家庭，而非工厂，硅谷的硬件迭代比深圳差很远，大家对遥操作有误解，靠世界模型拿到投资

戴尔科技：智能数据平台弥合数据鸿沟 三位一体数据保护体系护航企业安全

那些年的国民零食，为什么突然在拼多多火了？

AI再走一步，会发生什么？答案在“预见2026”

CCF HPC China 2025鄂尔多斯完美谢幕，共谱超算新篇章

生成式引擎优化GEO：在线零售商的新营销手册

数据中心电池储能系统如何抵御新兴网络威胁

英特尔如何解决数据中心液冷技术的“接头难题”？

Google发布Pixel 10系列及新AI智能助手功能

Google推出Gemini for Home智能家居新战略

网络攻击来袭也不用慌

Microsoft 因低成本模型趋势调整全球 AI 数据中心扩张计划

AI 时代：平衡企业效率与创意完整性的挑战

AI在医疗保健领域：趋势与转折点

Meta发布Llama 4，新一代旗舰AI模型

AI 代理决策的错误假设

Google 发布 Gemini 模型的速度快于其 AI 安全报告

AI 视频生成创企 Runway 以 30 亿美元估值融资 3.08 亿美元

Amazon Nova Act 重磅发布：挑战 OpenAI、Microsoft 和 Salesforce 的全新 AI 代理 SDK

DeepMind 详解 AGI 可能给世界带来的威胁

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

戴尔科技：智能数据平台弥合数据鸿沟三位一体数据保护体系护航企业安全