Selenium教程：如何从特定父元素中获取所有匹配的子元素

心靈之曲

发布时间：2025-10-14 08:17:20

313人浏览过

来源于php中文网

原创

selenium教程：如何从特定父元素中获取所有匹配的子元素

本教程详细介绍了如何使用Selenium WebDriver从一个特定的父级`div`元素中，高效地获取所有具有相同特征的子元素（例如`span`标签），并提取它们的文本内容。文章重点讲解了`find_elements`方法与CSS选择器和XPath两种定位策略的结合应用，以解决仅获取第一个匹配元素的问题，确保用户能够获取页面上所有符合条件的元素信息。

在自动化测试和网页数据抓取中，我们经常需要从一个复杂的HTML结构中提取特定信息。当目标信息存在于多个具有相同特征的子元素中时，如何高效且完整地获取所有这些元素就成为了一个关键问题。本教程将以一个具体的HTML结构为例，详细讲解如何使用Selenium WebDriver解决这一挑战。

理解find_element与find_elements的区别

在Selenium WebDriver中，有两个核心方法用于查找网页元素：find_element和find_elements。

find_element(By.STRATEGY, "locator")：这个方法用于查找单个元素。如果页面上有多个元素符合定位器的条件，它只会返回第一个匹配的元素。如果找不到任何元素，它会抛出NoSuchElementException。
find_elements(By.STRATEGY, "locator")：这个方法用于查找所有符合条件的元素。它会返回一个包含所有匹配元素的列表（list）。如果找不到任何元素，它会返回一个空列表，而不会抛出异常。

这就是为什么在使用find_element时，即使页面上存在多个目标元素，也只能获取到第一个的原因。要获取所有匹配的子元素，我们必须使用find_elements。

准备工作

在使用Selenium进行网页自动化时，首先需要导入必要的模块：

from selenium import webdriver
from selenium.webdriver.common.by import By
# 如果需要，可以导入等待相关的模块
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

假设我们有以下HTML结构，目标是获取所有class="indigo-text descfont"的span标签中的文本：


 Region:
 Alsace
 

 Vintage:
 2014
 

 Producer:
 Domaine Zind-Humbrecht

核心策略：定位多个子元素

为了从特定的父元素（这里是id="WineDetailContent"的div）中获取所有匹配的子元素（这里是class="indigo-text descfont"的span），我们需要构建一个精确的定位器。以下是两种常用的定位策略：CSS选择器和XPath。

方法一：使用CSS选择器定位

CSS选择器是一种简洁高效的定位方式，尤其适用于处理类名和ID。

CSS选择器语法解析：

Simplified

AI写作、平面设计、编辑视频和发布内容。专为团队打造。

下载

div#WineDetailContent：选择id为WineDetailContent的div元素。
span.indigo-text.descfont：选择同时拥有indigo-text和descfont这两个类名的span元素。
div#WineDetailContent span.indigo-text.descfont：表示选择id为WineDetailContent的div元素内部（作为其后代）所有同时拥有indigo-text和descfont类名的span元素。

示例代码：

# 假设driver已经初始化并导航到包含HTML的页面
# driver = webdriver.Chrome() 
# driver.get("your_page_url")

# 使用CSS选择器定位所有匹配的span元素
target_spans = driver.find_elements(By.CSS_SELECTOR, "div#WineDetailContent span.indigo-text.descfont")

# 提取并打印每个span元素的文本
print([element.text for element in target_spans])

方法二：使用XPath定位

XPath是另一种功能强大的定位方式，能够处理更复杂的层级关系和属性匹配。

XPath语法解析：

//div[@id='WineDetailContent']：选择页面上所有id属性为WineDetailContent的div元素。
//span[@class='indigo-text descfont']：选择页面上所有class属性为indigo-text descfont的span元素。
//div[@id='WineDetailContent']//span[@class='indigo-text descfont']：表示选择id为WineDetailContent的div元素内部（作为其任意层级的后代）所有class属性为indigo-text descfont的span元素。注意，//表示任意层级的后代，而/表示直接子元素。

示例代码：

# 假设driver已经初始化并导航到包含HTML的页面

# 使用XPath定位所有匹配的span元素
target_spans = driver.find_elements(By.XPATH, "//div[@id='WineDetailContent']//span[@class='indigo-text descfont']")

# 提取并打印每个span元素的文本
print([element.text for element in target_spans])

提取元素文本

无论使用哪种定位策略，find_elements方法都会返回一个WebElement对象的列表。要获取这些元素的文本内容，我们可以遍历这个列表，并对每个元素调用.text属性。使用列表推导式是Python中一种简洁高效的实现方式。

# target_spans 是通过 find_elements 方法获取到的 WebElement 列表

# 使用列表推导式提取所有元素的文本
extracted_texts = [element.text for element in target_spans]

# 打印结果
print(extracted_texts)

对于上述HTML示例，无论是使用CSS选择器还是XPath，上述代码都将输出：

['Alsace', '2014', 'Domaine Zind-Humbrecht']

注意事项与最佳实践

选择合适的定位器：
- CSS选择器通常比XPath更快，语法更简洁，对于ID和类名定位尤为方便。
- XPath功能更强大，可以处理更复杂的场景，例如通过文本内容定位、向上查找父元素等，但有时可能性能略低且可读性较差。
- 在实际项目中，应优先选择最稳定、最不易受页面结构变化影响的定位器。ID通常是最稳定的，其次是带有独特值的类名或属性。
处理空列表： find_elements在找不到匹配元素时会返回空列表。在处理返回结果时，应检查列表是否为空，以避免索引错误。
```
if target_spans:
    print("找到元素：", [e.text for e in target_spans])
else:
    print("未找到任何匹配元素。")
```

等待机制： 网页元素可能不会立即加载完成。在查找元素之前，建议使用Selenium的等待机制（显式等待或隐式等待），以确保元素在页面上可用。

# 显式等待示例
wait = WebDriverWait(driver, 10) # 最长等待10秒
target_spans = wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, "div#WineDetailContent span.indigo-text.descfont")))

关闭浏览器： 完成操作后，务必调用driver.quit()来关闭浏览器实例，释放资源。

通过本教程，您应该能够熟练地使用Selenium WebDriver的find_elements方法，结合CSS选择器或XPath，从复杂的HTML结构中准确地获取所有目标子元素，并提取所需的信息。

如何正确使用 CSS Grid 实现四列布局

如何在固定定位的 header 中正确缩放并居中显示 logo 图片

html空格符号怎么打_常用html空格代码输入方式【汇总】

如何在固定定位的 header 中正确缩放并居中显示 img 元素

如何在固定定位的 header 中正确缩放并适配 img 元素

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

765

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

640

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

764

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

639

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1305

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

549

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

709

2023.08.11

Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机（JVM）的核心工作原理与性能调优方法，包括 JVM 内存结构、对象创建与回收流程、垃圾回收器（Serial、CMS、G1、ZGC）对比分析、常见内存泄漏与性能瓶颈排查，以及 JVM 参数调优与监控工具（jstat、jmap、jvisualvm）的实战使用。通过真实案例，帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

2026.01.20

热门下载

网站特效

网站源码

网站素材

前端模板