dtd是定义xml文档结构和规则的语法规范,规定元素、属性、实体及符号的合法形式;通过元素声明定义名称与内容模型,属性声明设定类型与默认值,实体与符号声明支持内容复用和外部数据引用;xml验证时解析器比对文档是否符合dtd声明,检查根元素、标签嵌套、属性合规性及id唯一性等,违规则报错;dtd可内嵌于xml或通过系统/公共标识符外部引用;因其语法独立、无命名空间支持、类型有限,现多被xsd或relax ng取代,但仍用于html4、xhtml1.0等旧标准及轻量系统中,常见错误多源于属性默认值语义或内容模型符号误用。

DTD(Document Type Definition,文档类型定义)是一套用来定义XML文档合法结构和元素规则的语法规范。它规定了XML文档中允许出现哪些元素、元素可以如何嵌套、元素是否必须存在、属性有哪些及取值范围等,是XML验证最基础的机制。
DTD定义了什么内容
DTD通过声明方式描述XML的“骨架”,主要包括:
- 元素声明:用定义元素名称、内容模型(如EMPTY、#PCDATA、或子元素组合)
- 属性声明:用为元素指定属性名、类型(如CDATA、ID、ENUMERATED)、默认值(#REQUIRED、#IMPLIED等)
- 实体声明:用定义通用实体(如©)或参数实体(用于DTD内部复用)
- 符号声明:用声明外部非XML数据类型(如图片格式),常配合实体使用
DTD如何参与XML验证
当XML解析器以“验证模式”(validating parser)工作时,会将文档与关联的DTD进行比对,逐项检查是否符合定义。验证过程包括:
- 检查根元素是否与DTD中声明的根元素一致
- 确认每个开始标签都有对应声明,且内容符合其内容模型(比如某个元素只允许包含文本,却嵌套了子元素,就会报错)
- 核对所有属性是否存在、类型是否匹配、是否满足必需性要求(如#REQUIRED属性缺失即失败)
- 验证ID类型的属性值全局唯一,IDREF引用是否真实存在
一旦发现违反DTD规则的地方,解析器会停止处理并报告错误,不生成有效DOM或SAX事件。
DTD的关联方式
XML文档可通过三种方式关联DTD:
- 内部DTD:写在XML文档开头的.. [ ... ]>中,适合小型、自包含的文档
- 外部DTD(系统标识符):用引用本地文件
- 外部DTD(公共标识符):用引用标准化的公共DTD(需目录支持)
DTD的局限与现状
DTD语法独立于XML(使用自定义语法规则),不支持命名空间,数据类型简单,重用性和扩展性较差。现代应用更多采用XML Schema(XSD)或Relax NG替代DTD进行结构约束。但DTD仍广泛用于HTML4、XHTML1.0等老标准,以及部分嵌入式或轻量级系统中。
基本上就这些。它不复杂但容易忽略细节,比如属性默认值语义或内容模型中的逗号与竖线区别——这些恰恰是验证失败最常见的原因。










