0

0

Python xml.etree.ElementTree教程 标准库ET模块增删改查

星降

星降

发布时间:2026-02-13 11:52:59

|

281人浏览过

|

来源于php中文网

原创

et.parse()用于解析文件并返回elementtree对象,et.fromstring()用于解析xml字符串并直接返回根element;二者不可混用,否则引发parseerror。

python xml.etree.elementtree教程 标准库et模块增删改查

ET.parse() 和 ET.fromstring() 到底该用哪个?

解析 XML 时选错入口函数,后续所有操作都可能出问题。ET.parse() 读文件,返回 ElementTree 对象;ET.fromstring() 解析字符串,直接返回根 Element。别把文件路径传给 fromstring()——它会把路径当 XML 内容解析,报 ParseError: not well-formed

  • 文件操作(如读取本地 config.xml):用 ET.parse("config.xml"),再调 .getroot() 拿根节点
  • 接口返回的 XML 字符串(如 response.text):直接传给 ET.fromstring(response.text)
  • parse() 支持 parser 参数(比如用 XMLParser(resolve_entities=False) 防 XXE),fromstring() 不支持
  • 性能上,如果只是临时解析一小段字符串,fromstring() 更轻量;频繁读大文件,parse() 的流式处理更稳

怎么安全地增删子节点,不崩掉父节点引用?

增删节点不是“写完就完”,ET 的节点是强引用对象。常见错误:循环中用 for child in root: 然后调 root.remove(child),结果漏删、报 RuntimeError: dictionary changed size during iteration

  • 删除多个匹配节点:先收集要删的节点,再统一删
    to_remove = [elem for elem in root if elem.get("type") == "temp"]
    for elem in to_remove:
      root.remove(elem)
  • 新增节点:用 root.append(<code>new_elem) 或 root.insert(i, <code>new_elem);别直接赋值 root[0] = new_elem(这会替换,不是插入)
  • 插入文本节点?别用 append(ET.Element("text")),文本属于 Element.text 属性,直接设 elem.text = "hello"
  • 注意:节点一旦被 remove(),它仍存在内存里,但脱离树结构;再调 elem.getparent() 会返回 None

find() / findall() 找不到元素?XPath 表达式没你想得那么自由

find()findall() 只支持极简 XPath:单层标签名、属性过滤("tag[@attr='val']")、通配符 "*"。不支持 //ancestor::、函数调用,也不跨层级自动搜索。

腾讯云AI代码助手
腾讯云AI代码助手

基于混元代码大模型的AI辅助编码工具

下载
  • 要找任意深度的 item:不能写 root.findall("//item")(会静默失败),改用 root.iter("item")
  • 属性值含空格或特殊字符?用引号包裹:find('book[@category="sci-fi"]'),单双引号均可,但必须一致
  • 匹配多个属性?XPath 不支持 and,只能嵌套:先 find('book[@category="tech"]'),再对结果调 .find('author[@lang="en"]')
  • 命名空间(如 <rss xmlns="<a href=" https:>http://purl.org/rss/1.0/"></rss>)必须注册前缀,否则 find("channel") 一定为空:
    ns = {"rss": "http://purl.org/rss/1.0/"}
    root.find("rss:channel", ns)

修改后保存 XML,中文乱码或格式全垮怎么办?

tree.write() 默认用 ASCII 编码,且不缩进、不换行。直接写会导致中文变 中文,或者所有标签挤成一行,Git diff 失效。

立即学习Python免费学习笔记(深入)”;

  • 保存中文:显式指定 encoding="utf-8"xml_declaration=True
    tree.write("out.xml", encoding="utf-8", xml_declaration=True)
  • 想带缩进?标准库 ET 不提供 自动美化功能。别信网上那些“加 method="xml" 就能缩进”的说法——那是 lxml 的行为。ET 原生只输出扁平 XML
  • 如果真需要可读格式,要么手动拼接换行缩进(不推荐),要么换用 lxml.etree(兼容 ET 接口,多一行 from lxml import etree as ET 即可,然后用 ET.indent(tree)
  • 还有个坑:write() 默认覆盖文件,没备份机制。生产环境写关键配置前,建议先 shutil.copy("config.xml", "config.xml.bak")

ET 的设计哲学是“够用就好”,不是为了覆盖所有 XML 场景。它快、轻、无依赖,但 XPath 能力弱、不支持 DTD/Schema 验证、写入格式控制差——这些地方卡住时,别硬扛,该换 lxml 就换。真正麻烦的从来不是语法,而是你忘了它根本没实现你脑补的那个功能。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1927

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2100

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1120

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

529

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

214

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1550

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

640

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

863

2024.03.22

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.2万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号