XML实体是定义和引用可重用文本片段的机制,分内部实体(DTD中直接定义短内容)和外部实体(引用外部文件),需在DTD声明后以&entityName;引用,但受解析支持、安全限制及使用位置约束。

XML实体是一种在XML文档中定义和引用可重用文本片段的机制,它让相同内容(比如版权信息、公司名称、常用路径)能在多处统一维护、一处修改、处处生效。
XML实体的两种基本类型
XML实体分为内部实体和外部实体:
- 内部实体:直接在DTD或内部子集里定义文本值,适合短小、静态的内容,例如:
- 外部实体:指向外部文件(如 .txt 或 .xml),适合大段内容或需要独立管理的文本,例如:
如何在文档中定义并使用内部实体
必须先在文档类型定义(DTD)部分声明,再在文档体中通过&entityName;引用:
- 在内添加内部子集,例如:
appname "SuperApp">
]> - 在元素内容中使用:
Welcome to &appname; &version;
外部实体的典型用法与注意事项
外部实体能加载外部文件内容,但需注意安全性和解析支持:
- 声明方式示例:(纯文本)或(XML格式)
- 引用时写成:&footer;,解析器会把文件内容原样插入到该位置
- 多数XML处理器默认不解析外部实体(出于安全考虑),需显式启用;禁用外部实体是防御XXE攻击的关键措施
实际应用中的常见限制
不是所有场景都支持实体引用:
- 实体只能在XML文档体(元素内容或属性值)中使用,不能用于元素名、属性名或XML声明中
- 属性值中使用实体时,需确保属性类型为CDATA或未指定为其他类型(如ID/IDREF),否则可能校验失败
- 现代工具链(如JSON优先环境、某些Web API)往往不处理DTD,因此实体功能在纯XML交换中更常见,REST/HTTP服务中较少依赖
基本上就这些。实体本质是XML的“文本宏”,简单但有约束,用对了能提升可维护性,用错了容易引发解析失败或安全风险。










