优先使用XDocument、处理空值与异常、验证XML结构、避免硬编码XPath、安全访问属性、用XmlSerializer反序列化解析复杂结构,结合命名空间显式声明、流式读取大文件、禁用DTD防攻击、统一编码为UTF-8、使用CDATA包裹特殊字符、缓存解析结果、格式化输出、添加注释、编写单元测试、借助静态分析工具、文档化结构变更,提升代码健壮性与可维护性。

在C#开发中,处理XML数据是常见需求,尤其在配置文件读取、Web服务通信或数据交换场景中。但不规范的解析方式容易引发空引用、格式错误、性能问题等。以下是20个实用编码习惯,帮助你减少错误、提升代码健壮性和可维护性。
1. 优先使用XDocument而非XmlDocument
XDocument 属于LINQ to XML,语法更简洁,支持LINQ查询,适合现代C#开发。相比老旧的 XmlDocument,它更易读且不易出错。
- 用
XDocument.Load(path)或XDocument.Parse(xmlString) - 避免使用 XmlDocument 和 XmlNode 的深层嵌套判断
2. 始终检查XML是否为空或null
解析前验证输入,防止空引用异常。
- 检查文件是否存在:
File.Exists(path) - 字符串非空:
!string.IsNullOrWhiteSpace(xml)
3. 使用Try-Catch处理加载异常
XML格式错误很常见,必须捕获 XmlException。
try { var doc = XDocument.Parse(input); }
catch (XmlException ex) { /* 记录日志 */ }4. 启用XML验证(配合XSD)
对关键数据使用XSD验证结构和类型,提前发现问题。
- 使用
XmlReader配合XmlSchemaSet进行验证 - 适用于配置文件、接口报文等强约束场景
5. 使用命名空间时显式声明XNamespace
忽略命名空间是常见错误。正确处理如下:
XNamespace ns = "http://example.com/schema"; var element = root.Element(ns + "Name");
6. 不要硬编码XPath字符串
硬编码XPath难以维护。建议:
- 将路径定义为常量
- 或使用强类型的对象映射(如反序列化)替代
7. 避免频繁使用XPathSelectElements
虽然方便,但 XPathSelectElements 性能较低,且依赖字符串。推荐使用原生LINQ查询:
doc.Descendants("Item").Where(e => e.Attribute("Active")?.Value == "true")8. 安全访问元素和属性:使用 ?. 和 ??
避免空引用的关键技巧:
string name = element?.Element("Name")?.Value ?? "Unknown";属性同样适用:attr?.Value ?? "default"
9. 转换值时使用TryParse模式
不要直接转换,防止格式异常:
if (int.TryParse(element?.Value, out int id)) { /* 使用id */ }10. 使用强类型类 + XmlSerializer 解析复杂结构
对于层级清晰的XML,定义类并用 XmlSerializer 反序列化,降低出错概率。
- 配合 [XmlElement], [XmlAttribute] 等特性精确映射
- 生成代码可复用,逻辑更清晰
11. 处理大文件时使用XmlReader流式读取
大XML文件用XDocument会占用大量内存。改用 XmlReader 逐节点读取:
- 只遍历一次,低内存消耗
- 适合日志、批量导入等场景
12. 设置XmlReaderSettings增强安全性
防止XXE(XML外部实体)攻击:
var settings = new XmlReaderSettings { DtdProcessing = DtdProcessing.Prohibit }; 禁用DTD、外部资源加载,提升安全等级。
13. 输出XML时设置格式化选项
写入文件时启用缩进,便于调试和查看:
doc.Save(path, SaveOptions.None); // 默认格式化 // 或 doc.Save(writer, SaveOptions.DisableFormatting); // 紧凑输出
14. 使用CDATA包裹含特殊字符的文本
避免转义错误,特别是HTML或脚本内容:
new XCData("")15. 不要在循环中重复解析同一文档
解析成本高,应缓存XDocument实例或提取所需数据后操作。
- 例如:先提取所有Items列表,再遍历处理
16. 统一编码处理(UTF-8为主)
保存或读取时明确指定编码,避免乱码:
using var reader = new StreamReader(path, Encoding.UTF8); var doc = XDocument.Load(reader);
17. 添加注释说明关键节点用途
团队协作中,代码注释有助于理解XML结构意图。
- 说明字段业务含义
- 标注可选/必填状态
18. 单元测试覆盖典型XML样例
准备多种测试用例:
- 正常数据
- 缺失字段
- 非法值
- 命名空间变化
确保解析逻辑稳定。
19. 使用静态分析工具检查潜在问题
借助 ReSharper、Roslyn 分析器或 SonarLint 检测空引用、资源未释放等问题。
- 标记可疑的 .Value 直接调用
- 提示未处理的异常路径
20. 文档化你的XML结构与变更历史
维护一份简单文档说明:
- 根节点、主要元素含义
- 版本演进记录
- 兼容性策略(如新增可选字段不影响旧解析)
减少沟通成本,避免误改。
基本上就这些。坚持这些习惯,能显著降低XML处理中的运行时错误,让代码更可靠、易读、易维护。










