0

0

怎么用Rust语言解析XML quick-xml库教程

畫卷琴夢

畫卷琴夢

发布时间:2025-12-13 13:49:03

|

329人浏览过

|

来源于php中文网

原创

quick-xml是Rust中解析XML最常用、性能最佳且文档最全的库,支持流式(Reader)和serde反序列化两种方式;需在Cargo.toml中添加quick-xml = { version = "0.35", features = ["encoding"] }以支持非UTF-8编码。

怎么用rust语言解析xml quick-xml库教程

用 Rust 解析 XML,quick-xml 是目前最常用、性能最好、文档较全的库。它支持流式(Reader)和树状(events + BytesStart 等)两种解析方式,兼顾内存效率和开发便利性。

安装 quick-xml 依赖

Cargo.toml 中添加:

[dependencies]
quick-xml = { version = "0.35", features = ["encoding"] }

注意:加 features = ["encoding"] 才能正确处理 UTF-8 以外的编码(如 GBK,不过实际中建议 XML 文件统一用 UTF-8)。

基础流式解析:读取元素和文本

适合大文件或只需提取部分字段的场景,不加载整个 XML 到内存。

示例 XML(book.xml):


  
    Rust编程入门
    张三
  
  
    XML精讲
    李四
  

Reader 逐事件解析:

use quick_xml::events::BytesStart;
use quick_xml::Reader;

fn main() -> Result<(), Box> {
    let xml = r#"
        
          
            Rust编程入门
            张三
          
        "#;

    let mut reader = Reader::from_reader(xml.as_bytes());
    reader.trim_text(true); // 自动忽略纯空白文本节点

    let mut buf = Vec::new();
    let mut books = Vec::new();

    loop {
        match reader.read_event_into(&mut buf) {
            Ok(quick_xml::events::BytesEvent::Start(e)) => {
                if e.name().as_ref() == b"book" {
                    let id = e.attributes()
                        .find(|a| a.key.as_ref() == b"id")
                        .map(|a| std::str::from_utf8(&a.value).unwrap_or("").to_string());
                    books.push((id, String::new(), String::new()));
                }
            }
            Ok(quick_xml::events::BytesEvent::Text(e)) => {
                let text = e.unescape_and_decode(&reader)?; // 安全解码实体(& → &)
                if let Some(last) = books.last_mut() {
                    // 简单逻辑:紧接在 title/author 开始标签后的文本即为内容
                    // 实际中建议用状态机或栈记录当前路径
                }
            }
            Ok(quick_xml::events::BytesEvent::Eof) => break,
            Err(e) => return Err(e.into()),
            _ => {}
        }
        buf.clear();
    }

    Ok(())
}

⚠️ 流式解析需手动维护上下文(比如当前在哪个标签内),适合结构简单或性能敏感场景。

VidAU
VidAU

VidAU AI 是一款AI驱动的数字人视频创作平台,旨在简化视频内容创作流程

下载

更推荐:用 events + 辅助类型提取结构化数据

不用自己写状态机,借助 BytesStartBytesTextReader::read_element 可清晰提取嵌套结构。

例如,定义一个结构体并从 XML 构建它:

use quick_xml::de::from_str;
use serde::{Deserialize, Serialize};

#[derive(Deserialize, Debug)]
struct Book {
    #[serde(rename = "@id")]
    id: String,
    title: String,
    author: String,
}

#[derive(Deserialize, Debug)]
struct Library {
    #[serde(rename = "$value")]
    books: Vec,
}

// 注意:quick-xml 的 serde 支持要求 XML 标签名与字段名匹配(或用 rename)
// 且需确保 XML 是形如 ... 这样扁平嵌套

然后直接反序列化:

let data = r#"

  
    Rust编程入门
    张三
  
"#;

let library: Library = from_str(data).map_err(|e| e.to_string())?;
println!("{:#?}", library);

✅ 前提是开启 quick-xmlserialize feature(已在 0.35+ 默认启用),并引入 serdeserde_derive

常见问题与技巧

  • 中文乱码 确保 XML 声明里写了 ,且文件本身是 UTF-8 编码;Rust 字符串默认 UTF-8,无需额外转码
  • 解析失败报 “invalid UTF-8”? 检查是否误把二进制数据(如 ZIP 内的 XML)当纯文本传入;用 std::fs::read 而非 read_to_string 读取原始字节再交给 Reader::from_reader
  • 想跳过某个标签?reader.read_to_end(name)? 快速消耗掉整段(含子节点)
  • 需要修改后再输出 XML?Writer 类型,配合 BytesStart / BytesText 构造事件写回

基本上就这些。quick-xml 上手不难,关键在于分清“流式遍历”和“结构反序列化”两种模式的适用场景——小文件、结构固定,优先用 serde;大文件、只取几个字段,用 Reader + 事件循环。

相关专题

更多
C++系统编程内存管理_C++系统编程怎么与Rust竞争内存安全
C++系统编程内存管理_C++系统编程怎么与Rust竞争内存安全

C++系统编程中的内存管理是指 对程序运行时内存的申请、使用和释放进行精细控制的机制,涵盖了栈、堆、静态区等不同区域,开发者需要通过new/delete、智能指针或内存池等方式管理动态内存,以避免内存泄漏、野指针等问题,确保程序高效稳定运行。它核心在于开发者对低层内存有完全控制权,带来灵活性,但也伴随高责任,是C++性能优化的关键。

10

2025.12.22

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1896

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2088

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1033

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

278

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1491

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

622

2023.11.24

菜鸟裹裹入口以及教程汇总
菜鸟裹裹入口以及教程汇总

本专题整合了菜鸟裹裹入口地址及教程分享,阅读专题下面的文章了解更多详细内容。

0

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.1万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号