XML声明必须以

编写一个合法的XML声明,关键在于正确使用版本号、编码格式以及可选的独立性声明。XML声明必须出现在文档的最开始位置,且前面不能有任何字符(包括空格或BOM)。以下是具体规范和示例。
XML声明的基本结构
一个完整的XML声明语法如下:
其中包含三个可选属性,但version是必需的。
版本(version)属性规范
version属性指明所使用的XML标准版本。目前只支持以下两个值:
- version="1.0":最常用,符合W3C XML 1.0规范
- version="1.1":较少使用,支持更多控制字符,但兼容性较差
注意:不写version属性是非法的。如果省略整个声明,则默认视为version="1.0",但显式写出更规范。
编码(encoding)属性规范
encoding属性说明文档实际使用的字符编码。常见合法值包括:
- UTF-8:推荐使用,兼容ASCII,支持所有Unicode字符
- UTF-16:适用于双字节为主的语言环境
- ISO-8859-1:西欧语言常用
- GBK / GB2312:中文环境有时使用(需确保解析器支持)
encoding值必须是IANA注册的字符集名称,大小写不敏感,但建议使用大写开头或全小写统一风格。若未指定,默认为UTF-8(在XML 1.0中实际默认为UTF-8,尽管规范说无BOM时按UTF-8处理)。
独立文档(standalone)属性说明
standalone用于指示文档是否依赖外部DTD定义:
- standalone="yes":表示文档内容不依赖外部DTD中的实体或属性默认值
- standalone="no":表示可能依赖外部DTD信息
该属性可省略。如果文档没有DOCTYPE声明,通常不需要设置。一旦使用,必须明确写出"yes"或"no",不允许其他值。
合法XML声明示例
以下是几种常见合法写法:
常见错误避免
以下写法会导致XML解析失败或被视为非法:
- 在声明前有空格或换行
- version属性缺失或拼写错误,如 verison="1.0"
- encoding值使用未注册名称,如 encoding="unicode"
- 属性值未加引号,如
- 使用单引号(部分解析器不支持)
基本上就这些。只要确保版本明确、编码合法、语法完整,就能写出一个符合规范的XML声明。










