XML External Entity攻击演示什么是XXE漏洞及其原理

幻夢星雲

发布时间：2026-02-12 10:39:10

742人浏览过

来源于php中文网

原创

XXE漏洞本质是XML解析器默认加载执行外部实体，需在每次解析前独立禁用：PHP须对每个解析函数调用libxml_disable_entity_loader(true)，Java须设disallow-doctype-decl为true，Python须用defusedxml并显式配置resolve_entities=False和no_network=True。

xml external entity攻击演示什么是xxe漏洞及其原理

XXE漏洞本质是解析器“照单全收”外部实体

XML解析器默认可能加载并执行用户可控的SYSTEM或PUBLIC实体，只要应用把原始XML喂给解析器且没关掉这个功能，攻击者就能读/etc/passwd、访问http://192.168.1.100:8080、甚至触发SSRF。这不是代码写错，而是配置松懈——就像让快递员直接拆开所有包裹再转交给你。

PHP里`libxml_disable_entity_loader(true)`必须在解析前调用

很多老项目只在开头写一次，但simplexml_load_string()、DOMDocument::loadXML()、xml_parse()等函数各自独立触发解析，每次调用前都得重置；漏掉一个就等于留个后门。

libxml_disable_entity_loader(true)只影响后续解析，不回溯已加载的上下文
PHP 8.0+ 默认为true，但升级不等于自动修复——旧代码仍可能显式设为false
若用了LIBXML_NOENT或LIBXML_DTDATTR标志，必须确保没同时启用LIBXML_LOADDTD

Java中`disallow-doctype-decl`比禁用外部实体更彻底

只关external-general-entities不够，攻击者可绕过：用注释包裹DOCTYPE，或用大小写混写ExTeRnAl骗过简单过滤。真正有效的是直接禁止DOCTYPE声明本身。

boardmix博思白板

boardmix博思白板，一个点燃团队协作和激发创意的空间，集aigc，一键PPT，思维导图，笔记文档多种创意表达能力于一体，将团队工作效率提升到新的层次。

下载

必须设置setFeature("http://apache.org/xml/features/disallow-doctype-decl", true)
该配置会直接抛SAXParseException，而非静默忽略——这是你该看到的日志线索
若用Spring的MarshallingHttpMessageConverter，需确认底层XmlBeanDefinitionReader也继承了该安全特性

Python用`defusedxml`不是可选项，是默认底线

原生xml.etree.ElementTree不解析外部实体，看似安全，但一旦项目引入lxml（比如用BeautifulSoup解析XML或调用requests的xml响应），风险立刻回归。而defusedxml从设计上就堵死所有路径。

替换from xml.etree import ElementTree为from defusedxml.ElementTree import parse
lxml用户必须显式传resolve_entities=False和no_network=True，缺一不可
别信“我只解析内部数据”——HTTP请求体、文件上传、配置项拼接都可能意外带入用户输入

最常被忽略的点：XXE防御不是一次性配置，而是每个XML解析入口都要独立加固。哪怕同一服务里有五个地方调用解析器，就得检查五次——因为攻击者只找那一个没关严的口子。

相关标签:

spring beautifulsoup xml 继承 public apache http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：XPath函数怎么用 string(), number(), count()函数详解下一篇：暂无

作者最新文章

豆包AI浏览器插件安装与使用教程，随时随地调用AI

2026-02-11 21:19

AI帮你写歌词和作曲，用豆包开启你的音乐创作之路

2026-02-11 21:21

电脑重装系统怎么分区最合理硬盘快速分区与4K对齐教程

2026-02-12 08:12

iPhone电池健康度下降太快？ | 避开这4个充电误区，让你的电池寿命多用两年

2026-02-12 08:31

笔记本小键盘打不出数字是怎么回事 NumLock键解锁教程

2026-02-12 08:32

安装系统提示Windows无法安装到这个磁盘怎么办 GPT与MBR分区转换教程

2026-02-12 08:48

C#文件系统WatchService .NET在Linux/macOS上如何使用底层文件监控

2026-02-12 08:50

电脑开机蓝屏代码NTFS_FILE_SYSTEM怎么解决磁盘文件系统错误修复

2026-02-12 09:02

微信网页版在线使用入口微信网页版免下载入口

2026-02-12 09:14

英语四六级查分时间一般在什么时候历年成绩公布时间规律总结【预测】

2026-02-12 09:45

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

spring框架介绍

本专题整合了spring框架相关内容，想了解更多详细内容，请阅读专题下面的文章。

120

2025.08.06

Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用，涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造（CSRF）防护、会话管理与安全漏洞防范。通过实际项目案例，帮助学习者掌握如何使用 Spring Security 实现高安全性认证与授权机制，提升 Web 应用的安全性与用户数据保护。

2026.01.26

Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据，或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1926

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2100

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1120

2024.11.28

apache是什么意思

Apache是Apache HTTP Server的简称，是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一，由Apache软件基金会开发和维护，Apache具有稳定、安全和高性能的特点，得益于其成熟的开发和广泛的应用实践，被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程，希望对各位有所帮助。

413

2023.08.23