保证XML良好格式的核心是严格遵守语法规范:标签须正确嵌套闭合、区分大小写且命名合法、属性值必须引号包裹、特殊字符需转义或用CDATA。

保证XML文件良好格式(Well-formed)的核心是严格遵守XML语法规范。只要满足基本语法规则,解析器就能正确读取,不依赖DTD或Schema。
标签必须正确嵌套和闭合
XML不允许交叉嵌套,所有开始标签都必须有对应结束标签(或使用自闭合形式)。常见错误如:<book><title>XML指南</book></title> 是非法的。
- 正确写法:<book><title>XML指南</title></book>
- 空元素用自闭合:<author/> 或 <author></author>,二者等价但风格需统一
区分大小写且命名合法
XML标签名区分大小写,<Book> 和 <book> 被视为不同元素。名称不能以数字或标点开头,不能含空格、冒号(除非用于命名空间)、尖括号、引号等。
- 允许:<bookTitle>、<_id>、<item2>
- 禁止:<2ndItem>、<my title>、<book:title>(冒号需配合命名空间声明)
属性值必须加引号
所有属性值无论内容如何,都必须用双引号或单引号包裹。不加引号或只对部分值加引号会导致解析失败。
- 正确:<book id="001" category='fiction'/>
- 错误:<book id=001>、<book id="001" category=fiction>
正确声明并处理特殊字符与CDATA
小于号(、&、";若内容含大量标记符号,可用 <![CDATA[...]]> 包裹,内部不解析。
- 例如:<desc>5
- 等效写法:<desc><









