XML上传安全性 XXE漏洞在文件上传时如何防范

星降

发布时间：2026-02-03 10:34:33

842人浏览过

来源于php中文网

原创

XXE漏洞源于XML解析器默认加载外部实体，需显式禁用DOCTYPE和外部实体；防御须在解析前校验内容、优先使用defusedxml等安全库，并推荐改用JSON等无实体格式。

xml上传安全性 xxe漏洞在文件上传时如何防范

XML解析器默认开启外部实体导致XXE

绝大多数XML解析器（如Java的DocumentBuilder、Python的xml.etree.ElementTree、PHP的libxml）在默认配置下会加载并解析外部实体（DOCTYPE中的SYSTEM或PUBLIC声明），这是XXE漏洞的根本成因。上传的XML文件一旦包含恶意 ]>，就可能触发敏感文件读取、SSRF甚至命令执行。

关键不是“要不要解析XML”，而是“是否显式禁用外部实体”。依赖框架默认行为等于裸奔。

Java：必须调用setFeature("http://apache.org/xml/features/disallow-doctype-decl", true)或setFeature("http://xml.org/sax/features/external-general-entities", false)
Python：xml.etree.ElementTree不安全，改用defusedxml.ElementTree；若用lxml，需设置parser = etree.XMLParser(resolve_entities=False)
PHP：调用libxml_disable_entity_loader(true)（注意：PHP 8.0+已废弃该函数，应改用LIBXML_NOENT | LIBXML_DTDLOAD等标志位控制）

仅校验文件后缀或Content-Type无法阻止XXE

攻击者可将恶意XML内容保存为report.pdf或image.jpg，再通过Content-Type: image/jpeg绕过前端/中间件的MIME类型检查。后端若仍按XML解析，XXE照常触发。

真正有效的校验是：在解析前确认内容确实是可信的XML结构，且不含危险声明。

大同搜索

多语言高质量的AI搜索

下载

对上传文件先做轻量级文本扫描：拒绝包含/code>、、SYSTEM、PUBLIC的原始字节流（注意编码绕过，如UTF-16 BOM + 混淆空格）
不要只检查首行或前1KB，XXE实体定义可能出现在任意位置
避免正则硬匹配——比/code>更健壮，但仍有被绕过风险；优先用解析器自身的禁用机制

用非XML格式替代是最彻底的防御

如果业务逻辑允许，直接放弃XML上传，改用JSON、YAML（需禁用!!python/object等危险标签）、CSV等无实体机制的格式。这不是妥协，而是消除攻击面的最有效手段。

很多所谓“必须用XML”的场景，其实只是历史接口约定，后端完全可兼容多格式并强制降级处理。

API层统一接受application/json，XML请求返回415 Unsupported Media Type
遗留系统集成时，在网关层做XML→JSON转换（如用XSLT或xmllint --xpath提取后转JSON），后端只处理JSON
若必须存XML，也应在入库前剥离DOCTYPE和ENTITY节点，仅保留...内纯内容

import defusedxml.ElementTree as ET
try:
    tree = ET.parse(upload_file)
except ET.ParseError as e:
    raise ValueError("Invalid or unsafe XML content") from e
# defusedxml 已默认禁用外部实体，无需额外配置

XXE的隐蔽性在于它不依赖代码执行，只靠解析器特性就能泄露数据。哪怕你把所有eval、exec都封死，只要XML解析器开着外部实体，上传一个文件就可能让服务器自曝内网IP或数据库密码。禁用开关的位置、时机、作用域，三者缺一不可。

PHP中XMLWriter怎么用流式生成XML文件

PHP SimpleXML如何添加子节点和属性 addChild

XML文件上传服务器怎么处理 PHP接收XML数据

PHP的SimpleXML怎么添加一个带命名空间的子节点

WordPress REST API如何自定义端点来接收XML文件

相关标签:

php python java js 前端 json apache 编码 app 字节后端 csv ai pdf 中间件 json Object xml Libxml 接口 public 作用域 bom 数据库 apache http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java如何自定义JAXB的类型适配器 XmlAdapter 下一篇：暂无

作者最新文章

EF Core MaxLength怎么用 EF Core字符串长度限制注解

2026-02-03 08:47

C# 动态类型dynamic使用方法 C# dynamic关键字有什么用

2026-02-03 08:53

2026年春节放假安排表：2026年过年是几月几号？【官方日历】

2026-02-03 09:00

C# using声明方法 C# 8中的using声明如何简化代码

2026-02-03 09:02

C# 数据库连接字符串构建器 C#如何使用SqlConnectionStringBuilder动态创建连接字符串

2026-02-03 09:11

交管12123忘记密码怎么办手机APP找回密码及重置方法【教程】

2026-02-03 09:13

C# Expression Bodied Members方法 C#如何使用=>简化方法和属性

2026-02-03 09:14

C# 文件路径操作方法 C#如何使用Path类处理路径

2026-02-03 09:15

鱼刺卡喉咙了怎么办别喝醋吞饭医生推荐的正确自救方法【关键时刻】

2026-02-03 09:19

C# 静态构造函数方法 C#静态构造函数何时被调用

2026-02-03 09:21

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

什么是中间件

中间件是一种软件组件，充当不兼容组件之间的桥梁，提供额外服务，例如集成异构系统、提供常用服务、提高应用程序性能，以及简化应用程序开发。想了解更多中间件的相关内容，可以阅读本专题下面的文章。

178

2024.05.11

Golang 中间件开发与微服务架构

本专题系统讲解 Golang 在微服务架构中的中间件开发，包括日志处理、限流与熔断、认证与授权、服务监控、API 网关设计等常见中间件功能的实现。通过实战项目，帮助开发者理解如何使用 Go 编写高效、可扩展的中间件组件，并在微服务环境中进行灵活部署与管理。

217

2025.12.18

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

425

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

538

2023.08.23