Racket 通过第三方 xml 包处理 XML,需手动安装并加载;支持从字符串或文件解析为 xexpr 结构,可构造 xexpr 生成 XML,用列表操作和模式匹配提取数据,强调 S-expression 的透明数据处理。

Racket 本身没有内置的 XML 解析/生成模块,但可以通过第三方包或调用系统工具来处理 XML。最常用、最自然的方式是使用 xml 包(由 Racket 社区维护),它提供类似 R 或 Python ElementTree 的树状解析能力,适合中小型 XML 数据操作。
安装并加载 xml 包
Racket 的 xml 包不是默认安装的,需手动安装:
- 在终端运行:
raco pkg install xml - 在代码中加载:
(require xml)
注意:该包与 R 语言的 XML 包无关,是 Racket 原生实现,依赖 libxml2(安装时会自动处理)。
读取 XML 字符串或文件
支持从字符串或文件路径解析 XML,返回一个结构化的 xexpr(S-expression 形式的 XML):
- 从字符串解析:
(xml->xexpr (read-xml (open-input-string " ")))- abc
- 从文件读取:
(xml->xexpr (document-element (read-xml (open-input-file "data.xml")))) - 结果形如:
'(root (item "abc")),可直接用 Racket 的列表操作函数处理
生成和写入 XML
Racket 推荐用 xexpr 构建结构,再转为 XML 字节流:
- 构造 xexpr:
'(rss (@ (version "2.0")) (channel (title "My Blog") (item (title "Post 1")))) - 转为 XML 字符串:
(xexpr->string ...) - 写入文件:
(call-with-output-file "out.xml" (lambda (out) (write-xml (xexpr->xml ...) out)))
注意:属性用 (@ (attr "val")) 表示;文本内容直接写字符串;嵌套结构用括号自然表达。
简单查询与提取数据
不依赖 XPath,但可用 match、filter 或递归遍历 xexpr 提取信息:
- 找所有
item标签:(filter (λ (e) (and (list? e) (eq? (car e) 'item))) my-xexpr) - 提取标题文本:
(cadr (assoc 'title item-elem))(假设结构是(item (title "text"))) - 更健壮的做法是写辅助函数,对嵌套结构做模式匹配
若需 XPath 支持,可考虑调用外部命令(如 xmlstar)或通过 FFI 绑定 libxml2 的高级接口,但日常使用 xexpr 已足够清晰高效。
基本上就这些。Racket 处理 XML 不追求“全自动”,而是强调用好 S-expression 这一核心抽象——把 XML 当作数据结构来读、写、变换,逻辑透明,调试直观。










