nokogiri是ruby中解析xml最常用且功能强大的库,支持从字符串或文件加载xml,通过css选择器或xpath查询节点,获取属性和文本内容,并处理解析错误,使用简单且性能良好。

Ruby 中解析 XML 最常用且功能强大的库是 Nokogiri。它支持 XML 和 HTML 的解析、搜索和修改,使用简单且性能良好。下面带你快速入门 Nokogiri 如何解析 XML。
安装 Nokogiri
在使用前,需要先安装 Nokogiri gem:gem install nokogiri
gem 'nokogiri'
bundle install。加载和解析 XML
你可以从字符串或文件中加载 XML 内容。以下是一个简单的 XML 示例:
xml_content = <<-XML<br>
<books><br>
<book id="1"><br>
<title>Ruby 入门指南</title><br>
<author>张三</author><br>
</book><br>
<book id="2"><br>
<title>Rails 实战</title><br>
<author>李四</author><br>
</book><br>
</books><br>
XML
使用 Nokogiri 解析这段 XML:
require 'nokogiri'<br><br>
doc = Nokogiri::XML(xml_content)<br>
# 确保没有解析错误<br>
puts doc.errors unless doc.errors.empty?
查询 XML 节点
Nokogiri 支持使用 CSS 选择器或 XPath 来查找节点。CSS 选择器示例:
Python v2.4版chm格式的中文手册,内容丰富全面,不但是一本手册,你完全可以把她作为一本Python的入门教程,教你如何使用Python解释器、流程控制、数据结构、模板、输入和输出、错误和异常、类和标准库详解等方面的知识技巧。同时后附的手册可以方便你的查询。
# 获取所有 book 节点<br>
books = doc.css('book')<br>
books.each do |book|<br>
puts "ID: #{book['id']}"<br>
puts "标题: #{book.at_css('title').content}"<br>
puts "作者: #{book.at_css('author').content}"<br>
end
XPath 示例:
# 使用 XPath 获取所有 book/title 文本<br>
titles = doc.xpath('//book/title/text()')<br>
titles.each { |title| puts title.to_s }
注意:css 返回节点集合,at_css 或 at_xpath 返回第一个匹配节点。
处理属性和文本内容
获取元素的属性用方括号,获取文本内容用text 方法。
book = doc.at('book')<br>
id = book['id'] # 获取 id 属性值<br>
title_text = book.at('title').text # 获取 title 的文本
也可以判断节点是否存在:
if book.at('title')<br>
puts "标题存在:#{book.at('title').text}"<br>
else<br>
puts "标题缺失"<br>
end
基本上就这些。Nokogiri 上手快,语法清晰,是 Ruby 处理 XML 的首选工具。只要会写 CSS 或 XPath,就能高效提取所需数据。









