0

0

如何防止xml外部实体注入攻击 详解XXE漏洞的原理与防御

畫卷琴夢

畫卷琴夢

发布时间:2025-11-19 19:42:05

|

720人浏览过

|

来源于php中文网

原创

xxe漏洞源于xml解析器未禁用外部实体,导致攻击者可读取文件、探测内网或触发ssrf;防御需禁用dtd和外部实体,如java配置安全特性、python使用lxml禁用解析网络请求,并优先采用json替代xml,配合输入验证与低权限运行环境,即可有效防范。

如何防止xml外部实体注入攻击 详解xxe漏洞的原理与防御

XML外部实体注入(XXE)是一种常见的安全漏洞,主要出现在应用程序解析XML输入时未正确处理外部实体定义。攻击者可以利用该漏洞读取服务器本地文件、执行远程请求、进行端口扫描甚至实现服务器端请求伪造(SSRF),严重威胁系统安全。理解其原理并采取有效防御措施至关重要。

XXE漏洞的原理

XML支持自定义实体,通过DOCTYPE声明引入内部或外部实体。外部实体可指向本地文件或远程资源。当应用程序使用弱配置的XML解析器处理用户提交的XML数据时,会解析这些恶意实体,导致信息泄露。

例如,攻击者提交如下XML:



  
]>
&xxe;

若解析器未禁用外部实体,就会将&xxe;替换为/etc/passwd文件内容并返回给攻击者。

常见攻击场景与危害

  • 读取敏感文件:如/etc/shadow配置文件、私钥等。
  • 探测内网服务:通过构造URL请求内网IP和端口,判断开放情况。
  • 发起SSRF攻击:借助服务器身份访问内部系统,绕过防火墙限制。
  • 拒绝服务(DoS):利用“亿万笑脸”攻击,通过递归实体耗尽CPU和内存。

有效的防御策略

防止XXE的核心是禁用外部实体处理,并最小化XML解析的风险。

  • 禁用外部实体和DTD解析
    在代码中配置XML解析器不加载外部实体。例如:
    • Java(使用DocumentBuilder):
      builder.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true);
      builder.setFeature("http://xml.org/sax/features/external-general-entities", false);
      builder.setFeature("http://xml.org/sax/features/external-parameter-entities", false);
    • Python(lxml):
      from lxml import etree
      parser = etree.XMLParser(resolve_entities=False, no_network=True)
      etree.parse(io.StringIO(xml_data), parser)
    • PHP(libxml):
      libxml_disable_entity_loader(true);
  • 使用更安全的数据格式
    优先采用JSON替代XML进行数据传输,避免解析复杂结构带来的风险。
  • 及时更新解析库
    保持XML处理库最新,修复已知漏洞。
  • 输入验证与白名单控制
    对所有XML输入进行严格校验,仅允许必需的元素和属性,拒绝包含DOCTYPE等关键字的请求。
  • 运行环境隔离
    XML解析服务应运行在低权限账户下,限制文件系统访问范围。

检测与测试建议

可通过手动构造带外部实体的XML请求测试应用是否受影响。也可使用工具如Burp Suite拦截请求,修改Body内容加入恶意实体,观察响应是否包含预期文件内容或产生DNS/HTTP外联行为。

启用日志记录XML解析异常,监控可疑请求模式,有助于早期发现潜在攻击。

基本上就这些。XXE虽老但依然常见,关键是不让解析器执行危险操作。只要关闭DTD和外部实体,大多数问题都能避免。安全编码习惯加合理配置,就能有效抵御此类攻击。不复杂但容易忽略。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

453

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

331

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1944

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2118

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1160

2024.11.28

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1944

2024.04.01

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP安全与漏洞
PHP安全与漏洞

共12课时 | 2.2万人学习

PHP课程
PHP课程

共137课时 | 13.1万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号