CDATA是XML中用于包裹不被解析的纯文本的标记,以结尾,中间内容原样保留;不可嵌套,不能含XML声明或注释;适用于嵌入HTML、代码等场景,属性值中不可用。

CDATA 是 XML 中用于包裹一段“不被解析”的纯文本内容的特殊标记,它的作用是告诉 XML 解析器:这段内容里的所有字符(包括 、&、" 等)都**不要当作 XML 语法处理**,直接当作文本原样保留。
CDATA 的基本写法
CDATA 区块必须用固定格式声明:
- 以
开头(注意:左方括号前是感叹号,且中间**不能有空格**) - 以
]]>结尾(两个右方括号后紧跟一个大于号,中间也不能有空格或换行) - 中间的内容完全自由,可以包含任意字符,包括未转义的
、、双引号等
例如:
CDATA 的使用限制
虽然方便,但要注意几个硬性约束:
- CDATA 区块**不能嵌套**——即内部不能再出现
,否则解析会提前终止 - 结尾标记
]]>是严格关键字,如果原文中真要输出这串字符,必须拆开写(比如写成]]>→]]>可改写为]]>或用字符串拼接方式绕过) - XML 声明、DOCTYPE、注释、处理指令等**不能出现在 CDATA 内部**,它们只在外部起作用
什么时候该用 CDATA?
典型适用场景包括:
- 嵌入 HTML 片段(如富文本描述字段)
- 存放代码示例(JavaScript、XML、SQL 等含大量尖括号和符号的内容)
- 避免对大量特殊字符逐个进行实体编码(如把
写成zuojiankuohaophpcn) - 与某些旧系统交互时,对方要求原始格式不被破坏
替代方案:什么时候不该用 CDATA?
如果只是个别字符需要保护,用实体编码更轻量、更兼容:
-
zuojiankuohaophpcn替代 -
&替代& -
"替代"
尤其在属性值中,CDATA 不可用(属性值只能用引号包裹 + 实体编码),所以别试图在 这样写——这是非法的。
基本上就这些。用对地方,CDATA 能省不少转义功夫;用错位置,反而会让 XML 失效或被截断。










