OpenAI 警示：AI 浏览器恐难完全摆脱提示注入风险

霞舞

发布时间：2025-12-23 19:11:02

635人浏览过

来源于php中文网

原创

openai 近日公开表示，具备代理（agent）功能的 ai 浏览器在架构层面难以根除“提示注入”（prompt injection）攻击隐患。即便不断升级防护机制，该问题仍被定性为一项需长期应对的安全挑战，而非可通过单一技术手段彻底“攻克”的缺陷。为此，公司正加快安全补丁发布频率，并依托大规模自动化攻防对抗实验，在真实攻击发生前主动挖掘 atlas 浏览器中潜藏的薄弱环节。

OpenAI 警示：AI 浏览器恐难完全摆脱提示注入风险

今年 10 月，OpenAI 正式将 Atlas AI 浏览器集成进 ChatGPT 后，安全研究人员迅速验证：仅需在 Google Docs 等开放网页中插入简短文本，即可悄然劫持浏览器底层逻辑，暴露出“代理模式”在接入邮箱、第三方网站等不受控环境时，其攻击面被大幅扩展的事实。几乎同一时间，Brave 浏览器团队也在官方博客中指出，间接式提示注入是所有 AI 浏览器共有的结构性难题，Perplexity 推出的 Comet 等同类产品亦未能幸免。

这一判断并非 OpenAI 独有。英国国家网络安全中心（NCSC）本月早些时候发布警示称，针对生成式 AI 应用的提示注入攻击“或将永远无法被彻底遏制”，相关漏洞可能引发波及广泛的用户数据泄露事件。NCSC 建议安全团队重心转向“风险与影响控制”，而非执着于追求绝对防御。OpenAI 在最新技术博客中亦明确表态：提示注入应被视作贯穿 AI 发展周期的核心安全命题，防御体系必须持续演进、动态加固。

在具体防御思路上，OpenAI、Anthropic 与 Google 等头部厂商已形成基本共识——即采用多层防护叠加 + 持续高强度压力测试。Google 近期的研究更聚焦于从系统设计与策略制定两个维度对“代理型架构”施加硬性约束，例如通过精细化访问控制和行为白名单机制压缩潜在攻击空间。

但 OpenAI 正尝试开辟一条差异化路径：构建一个“由大模型驱动的自动化攻击者”。该系统本质上是一个经强化学习训练、专精于模拟黑客行为的 AI 机器人，其核心任务是穷尽各种方式向 AI 代理“隐蔽投递”恶意指令。在内部测试中，该攻击机器人首先在仿真环境中发起试探性攻击，系统则实时呈现目标 AI 的推理链路与可能执行动作；攻击者据此迭代优化策略，反复冲击防线。OpenAI 认为，这种对模型内部决策过程的可观测性，是现实攻击者所不具备的独特优势，有助于更高效地识别深层漏洞。

据披露，该强化学习驱动的攻击者已能诱导代理完成数十步乃至上百步组成的复杂有害操作序列，并在此过程中发现此前未见于人类红队演练或外部漏洞报告的全新攻击路径。这与当前主流 AI 安全测试范式高度一致——先打造高自由度的“边界试探型代理”，再通过高频次模拟推演反向驱动防御能力升级。

在最新演示中，OpenAI 展示了该自动化攻击者如何向用户邮箱悄悄植入一封伪装邮件。当 AI 代理后续扫描收件箱、准备撰写外出自动回复时，受邮件内嵌指令误导，误将一封预设的辞职信作为正式邮件发出。OpenAI 表示，经过最近一轮安全更新，Atlas 的“代理模式”现已可识别此类提示注入行为并即时向用户发出风险预警。公司同时强调，尽管提示注入难以实现“零风险”防护，但将持续扩大自动化测试规模、缩短补丁响应周期，力争在漏洞被实际利用前完成闭环修复。

AIBox 一站式AI创作平台

AIBox365一站式AI创作平台，支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

OpenAI 发言人未透露上述更新是否已在统计层面显著压降成功攻击率，但确认自 Atlas 上线前起，公司已联合多家第三方安全机构开展常态化攻防演练，以系统性提升其对提示注入类威胁的抵御能力。

外部安全专家对此策略普遍持谨慎乐观态度。网络安全公司 Wiz 的首席安全研究员 Rami McCarthy 指出，强化学习确为一种可随攻击手法演进而自我调优的防御增强手段，但仅靠它无法构成完整解决方案。他提出，评估 AI 系统风险的有效框架应为“自治等级 × 权限广度”的乘积模型。依此坐标系，兼具一定自主决策能力且握有极高数据访问权限的“代理浏览器”，天然处于高风险象限。

因此，业内诸多建议均围绕“收缩暴露面”与“约束自主权”展开。例如，减少代理在已登录状态下接触敏感账户的频次，以压缩攻击入口；对消息发送、资金支付等关键动作强制引入用户二次确认机制，从而将代理的行动自由度限定在可控范围内。OpenAI 方面表示，Atlas 已被专门训练，在执行消息发送或支付操作前必先请求用户明确授权。公司亦建议用户采用精准、具象的任务指令来引导代理，避免授予泛化权限，如不应简单授权其“全面管理邮箱并自行决定所有操作”。正如 OpenAI 所强调，赋予代理过宽的操作边界，会极大增加隐藏或恶意内容干扰其判断的概率，即使系统本身已部署多重防护措施。

尽管 OpenAI 将保障 Atlas 用户免遭提示注入攻击列为“最高优先级事项”，McCarthy 仍提醒业界保持理性审视：就现阶段多数日常使用场景而言，“代理浏览器”所带来的效率增益，尚不足以完全覆盖其所承载的高风险属性。这类工具对邮箱、支付凭证等核心敏感信息拥有深度访问权限，既是其能力根基，亦是最大软肋，而这种能力与风险的尖锐对峙，在短期内仍将难以调和。

源码地址：点击下载

完全 AI Coding 的性能优化 | zorm v1.8.1发布

EasyGoAdmin 敏捷开发框架 Beego+Layui 版本 v3.0.0 发布

项目流：类似禅道的项目管理软件，支持微信登录

多数人没发现隐藏在Google Maps的「这项功能」！将完全改变看导航的习惯

EasyGoAdmin 敏捷开发框架 GoFrame+AntdVue 版本 v2.6.0 发布

相关专题

ChatGPT注册

ChatGPT注册方法：1、访问OpenAI的官方网站，进入注册页面；2、完成注册后收到一份邮件，打开后点击验证账号；3、选择一个适合您需求的订阅计划；4、获得访问ChatGPT的权限即可。

559

2023.09.12

国内免费ChatGPT大全

ChatGPT是一种基于深度学习技术的自然语言处理模型，由OpenAI开发。它是GPT的一个变体，专门设计用于生成上下文相关的文本回复。ChatGPT被训练成一个聊天机器人，可以与用户进行对话交互。更多关于ChatGPT的文章详情请查看本专题，希望对大家能有所帮助。

618

2023.10.25

手机安装chatgpt的方法

手机安装chatgpt的方法：1、在ChatGTP官网或手机商店上下载ChatGTP软件；2、打开后在设置界面中，选择语言为中文；3、在对局界面中，选择人机对局并设置中文相谱；4、开始后在聊天窗口中输入指令，即可与软件进行交互。想了解更多chatgpt的相关内容，可以阅读本专题下面的文章。

3045

2024.03.05

chatgpt国内可不可以使用

chatgpt在国内可以使用，但不能注册，港澳也不行，用户想要注册的话，可以使用国外的手机号进行注册，注意注册过程中要将网络环境切换成国外ip。想了解更多chatgpt的相关内容，可以阅读本专题下面的文章。

1101

2024.03.05

Java 网络安全

本专题聚焦 Java 在网络安全与加密通信中的应用，系统讲解常见加密算法（MD5、SHA、AES、RSA）、数字签名、HTTPS证书配置、令牌认证（JWT、OAuth2）及常见安全漏洞防护（XSS、SQL注入、CSRF）。通过实战项目（如安全登录系统、加密文件传输工具），帮助学习者掌握 Java 安全开发与加密技术的实战能力。

742

2025.10.13

PHP 安全与防护

本专题聚焦于PHP开发中的安全问题与防御措施，详细讲解SQL注入、XSS攻击、CSRF攻击、文件包含漏洞等常见安全风险及其修复方法。通过结合实际案例，帮助开发者理解漏洞成因，掌握输入验证、会话安全、加密存储与安全编码规范，全面提升PHP网站的安全防护水平。

135

2025.11.04

PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境（CLI）下的开发与应用，内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理，以及与 Linux 定时任务（Cron）的结合使用。通过实战示例，帮助开发者掌握使用 PHP 构建自动化脚本、批处理工具与后台任务程序的能力。

2025.12.13

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

热门下载

网站特效

网站源码

网站素材

前端模板