getElementsByTagName() 方法最直接有效,用于获取指定标签名的所有元素,返回实时 NodeList,可作用于 Document 或 Element,参数为标签名字符串。

Java DOM 中获取指定标签名的所有元素,用 getElementsByTagName() 方法最直接有效。
使用 getElementsByTagName() 获取所有匹配元素
这是 DOM API 提供的标准方法,返回一个 NodeList,包含当前节点下所有指定标签名的 Element 节点(不区分大小写,按 XML/HTML 规范处理)。
- 调用对象可以是
Document(查全文档),也可以是任意Element(查其子树) - 参数是标签名字符串,如
"div"、"a"、"book" - 返回的
NodeList是实时的(live),后续 DOM 变化会反映在该列表中
基础代码示例
假设已加载好 Document doc:
NodeList divList = doc.getElementsByTagName("div");
for (int i = 0; i < divList.getLength(); i++) {
Element div = (Element) divList.item(i);
System.out.println("ID: " + div.getAttribute("id"));
System.out.println("Text: " + div.getTextContent().trim());
}
注意:必须强制转换为 Element 才能调用元素专属方法(如 getAttribute、getTextContent)。
立即学习“Java免费学习笔记(深入)”;
只取第一个或按条件筛选
如果只需要首个匹配元素,可直接取 item(0);若需更灵活筛选(如带特定 class 或属性),建议遍历后判断:
if (div.hasAttribute("class") && div.getAttribute("class").contains("active"))- 也可用
getElementsByTagName("*")获取所有元素,再逐个检查tagName
替代方案:XPath(适合复杂查询)
当需要 CSS 选择器类似能力(如 div.content a 或 input[type='text']),推荐用 XPath:
XPath xpath = XPathFactory.newInstance().newXPath();
NodeList links = (NodeList) xpath.compile("//a[@href]").evaluate(doc, XPathConstants.NODESET);
比纯 DOM 方法表达力更强,但需额外引入 XPath 支持,且性能略低。
基本上就这些。日常用 getElementsByTagName() 足够应对大多数“找同名标签”的需求,简单、标准、无需依赖。










