xml命名空间是唯一字符串标识符而非网址,解析器不发起网络请求;默认命名空间不作用于属性;xpath查询需正确映射命名空间,否则查不到节点。

XML命名空间不是网址,URI只是唯一ID
很多人一看到 xmlns:html="http://www.w3.org/1999/xhtml" 就去浏览器里打开那个地址,结果 404 —— 这完全没必要。那个 URI 不是链接,它只是一个**全球唯一的字符串标识符**,作用和 UUID 类似,只用来区分“这个 table 是 HTML 的 table,不是我数据库里的 table”。解析器根本不会发起网络请求。
- URI 可以是
http://、https://、urn:myapp:config,甚至xyz://abc,只要不重复就行 - 前缀(如
html:)纯属本地缩写,html:table和x:table指向同一 URI 时,语义完全等价 - W3C 标准命名空间(如 XHTML、XMLDSig)必须用官方 URI,否则验证会失败;自定义的则自己管好别撞车就行
默认命名空间不作用于属性,这是高频翻车点
写 xmlns="http://my.ns" 后,所有没加前缀的元素自动归属该空间——但属性不会。比如 <book id="123"></book> 中的 id 属性,永远属于“无命名空间”,哪怕它在默认命名空间元素内部。
- 想给属性加命名空间?必须显式带前缀:
<book my:id="123" xmlns:my="http://my.ns"></book> -
xml:id、xml:lang这类 W3C 预定义属性自带命名空间,不用再声明xmlns:xml,解析器认得 - 用 XPath 查属性时,
@id和@my:id完全是两回事;漏掉前缀或乱配命名空间映射,就查不到
解析 XML 时忽略命名空间,等于没写
Python 的 lxml、Java 的 DocumentBuilder、JavaScript 的 DOMParser 默认都严格区分命名空间。你用 //book 查不到 <book xmlns="http://my.ns"></book>,因为它的真正名字是 {http://my.ns}book。
- 正确做法:注册命名空间映射,再用前缀查询。例如 lxml 中:
root.xpath('//ns:book', namespaces={'ns': 'http://my.ns'}) - 临时绕过?可用
//*[local-name()='book'],但性能差、可读性低,上线前务必改掉 - XSD 验证也依赖命名空间匹配:
targetNamespace必须和实例文档中声明的 URI 完全一致,一个字符都不能错
嵌套与取消继承:子元素能覆盖,也能清空
命名空间作用域从声明处开始,向下继承到所有后代,但可以被子元素重新声明覆盖,甚至用 xmlns="" 主动清空。
- 覆盖示例:
<parent xmlns:ns="http://old"><child xmlns:ns="http://new"></child></parent>→child及其后代的ns:指向新 URI - 清空示例:
<div xmlns:html="http://x"><p xmlns="">纯文本</p></div>→p元素脱离命名空间,变成无命名空间元素 - 根元素上声明多个命名空间(如
xmlns:h+xmlns:f)最常见也最安全,避免深层嵌套时反复声明










