使用 xml:space="preserve" 可保留多行文本中的换行符;2. 解析时需配置解析器以防止空白被压缩;3. CDATA 区块能原样保留内容,适合含特殊字符的多行数据。

在XML中处理多行节点内容时,关键在于正确解析和保留换行符等空白字符。XML默认会将多个空白字符(包括换行、空格、制表符)压缩为单个空格,除非特别设置。要正确处理多行文本内容,需要从结构设计、属性设置和解析方式三方面入手。
使用 xml:space 属性控制空白处理
XML提供了 xml:space 属性来声明某节点内空白字符的处理方式:
- xml:space="default":空白字符可能被应用忽略或简化,这是默认行为。
- xml:space="preserve":保留所有空白字符,包括换行、空格和制表符。
示例:
这是一段 多行文本内容, 换行将被保留。
在解析时,只要解析器支持,这段内容中的换行就会原样读取。
在代码中正确读取多行内容
使用编程语言解析XML时,需确保解析器不会自动去除换行。以下是常见语言的处理建议:
-
Python (ElementTree):默认不保留换行,可配合
xml.etree.ElementTree手动处理文本中的 \n,并启用外部实体解析以支持预定义实体如 表示换行。 -
Java (DOM):使用
DocumentBuilderFactory设置setIgnoringElementContentWhitespace(false),并访问文本节点时保持原始字符串。 -
C# (XDocument/XElement):直接读取
Value属性可保留换行,前提是XML源中确实包含 \n 或 。
用实体或CDATA保留特殊格式
若多行内容包含大量换行或特殊字符,推荐使用 CDATA 区块避免转义问题:
CDATA 内部的所有内容都会被原样解析,包括换行和标签-like 字符串,适合日志、代码片段等场景。
基本上就这些方法。合理使用 xml:space、CDATA 和正确的解析配置,就能稳定处理XML中的多行节点内容。注意不同解析器的行为差异,测试时查看实际输出是否保留了换行。










