GPath是Groovy内置的路径表达式语法,专为遍历XmlSlurper/JsonSlurper解析后的嵌套数据设计,通过点号链式访问、@属性名、text()等实现简洁导航,区别于XPath和JSONPath。

什么是 GPath?它不是 XPath,也不是 JSONPath
GPath 是 Groovy 内置的路径表达式语法,专为遍历嵌套数据结构(如 XmlSlurper 解析后的 XML、JsonSlurper 解析后的 JSON、List/Map)设计。它看起来像属性访问,但背后是动态方法调用和重载操作符,不是标准规范,也不依赖外部引擎。
关键区别:XPath 是通用查询语言,需显式调用 evaluate();而 GPath 在 Groovy 中直接作用于对象,比如 xml.book.author 会自动匹配所有 下的 节点,返回一个 NodeChild 列表。
用 XmlSlurper + GPath 读取 XML,就像在访问对象属性
XmlSlurper 是 Groovy 推荐的轻量级 XML 解析器,解析后返回可 GPath 导航的对象树。它默认忽略空白文本节点,适合快速提取内容。
常见操作包括:
- 层级访问:用点号(
.)逐级下钻,如xml.root.child.grandchild - 同级多节点:直接写标签名,返回所有匹配子节点组成的列表(
xml.item) - 带条件筛选:用
find{}或findAll{}配合 GPath 表达式,如xml.book.find{ it.@category == 'fiction' } - 属性访问:用
@属性名,如book.@id获取的 id 值 - 文本内容:用
text()方法,如author.text()
def xml = new XmlSlurper().parseText('''
The Great Gatsby
F. Scott Fitzgerald
Sapiens
Yuval Noah Harari
''')
// 获取所有书名
def titles = xml.book.title*.text()
// → ['The Great Gatsby', 'Sapiens']
// 找出 fiction 类别的书的作者
def fictionAuthors = xml.book.findAll{ it.@category == 'fiction' }.author*.text()
// → ['F. Scott Fitzgerald']
为什么不能直接用 XmlParser?GPath 支持差异在哪
XmlParser 返回的是标准 DOM-like Node 对象,不支持 GPath 的点号链式访问(如 node.book.title 会报 MissingPropertyException)。它更接近 Java 原生 XML 处理,适合需要修改节点、保留注释/命名空间等场景,但牺牲了 GPath 的简洁性。
如果你写了 new XmlParser().parse(...) 却想用 GPath,会遇到:
groovy.lang.MissingPropertyException: No such property: book for class: groovy.util.Node-
it.@attr不生效,必须改用it.attribute('attr') -
it.children()才能拿到子节点,无法直接it.child
所以:要 GPath,必须用 XmlSlurper;要精确控制或写回 XML,再考虑 XmlParser + 手动遍历。
容易踩的坑:空值、命名空间、延迟求值
GPath 看似简单,但 Groovy 的动态性和懒加载特性会让一些行为出人意料:
-
空节点返回空列表而非 null:即使
xml.nonexistent没有匹配项,也返回空NodeChild列表,不会 NPE,但text()会返回空字符串,size()是 0 —— 别用== null判断是否存在 -
命名空间需显式声明:带 namespace 的 XML(如
)必须用new XmlSlurper(false, true)关闭命名空间感知,或用declareNamespace注册前缀,否则 GPath 匹配失败 -
延迟求值(lazy evaluation):
xml.book不是立即执行,而是返回一个代理对象;只有调用text()、size()或参与迭代时才真正解析。这在循环中重复调用xml.book是安全的,但不要误以为它是“缓存结果”
最常被忽略的一点:GPath 表达式本身不抛异常,错误只在你试图从空结果调用方法时暴露(比如对空列表调 [0].text()),建议用 ?.text() 或先检查 size() > 0。










