ElementTree 的 findall() 处理带命名空间 XML 时必须显式传入 namespaces 参数,命名空间映射需为字典格式,键为 XPath 中使用的前缀(不可为空字符串),值为完整且大小写敏感的 URI;漏传或映射错误将导致查不到元素。

ElementTree 处理带命名空间的 XML 时,findall() 默认不识别命名空间前缀,必须显式传入命名空间映射(namespace map),否则查不到元素。
命名空间映射要写成字典格式
XML 中像 这样的命名空间,需用字典把前缀和 URI 关联起来:
- 键是你在 XPath 中想用的前缀(比如
"ns"),不是 URI - 值必须是完整的命名空间 URI 字符串(注意:必须完全一致,包括末尾斜杠、大小写)
- 前缀名可以自定义,不一定要和 XML 中声明的一样(例如 XML 用
ns,你字典里写"x"也行,只要 XPath 里同步用"x:book")
findall() 调用时必须传入 namespaces 参数
不能只写 root.findall("ns:book"),得加上 namespaces=ns_map:
ns_map = {"ns": "http://example.com/ns"}
books = root.findall("ns:book", namespaces=ns_map)
漏掉 namespaces=... 参数,ElementTree 就当没命名空间处理,结果为空列表。
立即学习“Python免费学习笔记(深入)”;
本文档主要讲述的是Python之模块学习;python是由一系列的模块组成的,每个模块就是一个py为后缀的文件,同时模块也是一个命名空间,从而避免了变量名称冲突的问题。模块我们就可以理解为lib库,如果需要使用某个模块中的函数或对象,则要导入这个模块才可以使用,除了系统默认的模块(内置函数)不需要导入外。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看
通配前缀或忽略命名空间的临时办法
如果只想快速匹配所有同名元素,不管命名空间,可用星号通配:
-
root.findall("{*}book")—— 匹配任意命名空间下的book -
root.findall(".//{*}book")—— 深度查找所有book - 或者用
{http://example.com/ns}book写死完整 URI(省去字典,但可读性差)
注意默认命名空间(无前缀)的特殊处理
XML 中若写 (没有前缀),这个叫“默认命名空间”,ElementTree 不会自动把它映射到空字符串 ""。你得在字典中显式指定一个前缀来代表它:
ns_map = {"d": "http://example.com/ns"} # 不能用 "" 作键
books = root.findall("d:book", namespaces=ns_map)
空字符串键("")在 ElementTree 中会被忽略,所以必须选个非空前缀代替。
基本上就这些。核心就两点:字典映射写对、调用时别忘传 namespaces=。不复杂但容易忽略。









