0

0

C#如何安全地从用户上传的XML文件中读取数据? 验证与清理策略

月夜之吻

月夜之吻

发布时间:2025-12-01 12:21:06

|

659人浏览过

|

来源于php中文网

原创

禁用DTD和外部实体解析,防止XXE攻击;2. 使用XSD schema验证XML结构合法性;3. 限制MaxCharactersInDocument和MaxCharactersFromEntities防御DoS;4. 只提取必要字段并进行输出编码。

c#如何安全地从用户上传的xml文件中读取数据? 验证与清理策略

从用户上传的 XML 文件中读取数据时,必须防范恶意内容,如 XML 炸弹、外部实体注入(XXE)和格式错误导致的拒绝服务攻击。C# 提供了多种机制来安全地处理这些风险,关键在于禁用危险功能并进行结构验证。

禁用 DTD 和外部实体解析

XML 文档类型定义(DTD)是 XXE 攻击的主要入口。应始终在 XmlReaderSettings 中显式禁用 DTD 处理,防止加载外部资源。

  • 设置 DtdProcessing = DtdProcessing.ProhibitDtdProcessing.Ignore
  • XmlResolver 设为 null,阻止任何外部 URI 解析

示例代码:

var settings = new XmlReaderSettings
{
    DtdProcessing = DtdProcessing.Prohibit,
    XmlResolver = null,
    MaxCharactersFromEntities = 1024,
    MaxCharactersInDocument = 102400 // 限制文档总大小
};
using var reader = XmlReader.Create(stream, settings);
var doc = new XmlDocument();
doc.Load(reader);

使用 Schema 验证结构合法性

仅语法正确不足以保证安全,还需验证内容结构是否符合预期。通过 XSD schema 可限定允许的元素、属性和数据类型。

  • 预先定义可信的 XSD 文件
  • XmlReaderSettings 中添加 Schemas 并启用 ValidationType = ValidationType.Schema
  • 处理 ValidationEventHandler 捕获不符合规则的内容

示例:

PaperAiBye
PaperAiBye

支持近30多种语言降ai降重,并且支持多种语言免费测句子的ai率,支持英文aigc报告等

下载
var settings = new XmlReaderSettings();
settings.Schemas.Add("", "schema.xsd");
settings.ValidationType = ValidationType.Schema;
settings.ValidationEventHandler += (sender, args) =>
{
    throw new ArgumentException($"XML 验证失败: {args.Message}");
};

限制资源消耗防御 DoS

即使没有恶意代码,极深嵌套或大量实体仍可能耗尽内存。需设置硬性上限。

  • MaxCharactersInDocument:限制整个文档字符数
  • MaxCharactersFromEntities:防止实体扩展爆炸
  • 避免使用 InnerText 加载大文本,改用流式读取

清理与最小化数据提取

只提取所需字段,忽略多余节点。不要直接将 XML 节点用于后续逻辑或拼接到输出中。

  • 使用 XPath 或 LINQ to XML 按白名单方式选取特定元素
  • 对提取的字符串执行必要的编码或转义(如写入 HTML 或数据库)
  • 不信任任何属性值,尤其是包含文件路径、URL 的字段

例如:

var name = doc.SelectSingleNode("//user/name")?.InnerText ?? "";
name = WebUtility.HtmlEncode(name); // 输出前编码

基本上就这些。只要做到禁用 DTD、强制 schema 验证、限制资源、按需提取,就能大幅降低 XML 处理风险。安全的核心不是“能解析”,而是“只接受明确允许的”。

相关专题

更多
html版权符号
html版权符号

html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

611

2023.06.14

html在线编辑器
html在线编辑器

html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

650

2023.06.21

html网页制作
html网页制作

html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

468

2023.07.31

html空格
html空格

html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

245

2023.08.01

html是什么
html是什么

HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

2891

2023.08.11

html字体大小怎么设置
html字体大小怎么设置

在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

505

2023.08.11

html转txt
html转txt

html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

311

2023.08.31

html文本框代码怎么写
html文本框代码怎么写

html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

424

2023.09.01

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

27

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Bootstrap 5教程
Bootstrap 5教程

共46课时 | 2.9万人学习

AngularJS教程
AngularJS教程

共24课时 | 2.7万人学习

CSS教程
CSS教程

共754课时 | 19.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号