
本文详解如何通过 python + selenium 定位包含图片链接的 `
在网页自动化采集中,常需从特定容器(如 class="goods_descr_images" 的
正确做法是:先定位父级 ⚠️ 关键注意事项: * 包含企业网所需要要的所有常用功能 * 单页企业信息页面(如公司简介、联系方式等类似页面)可以自由增加删除,自己设置文件名 * 完整的产品功能模块 * 人才招聘模块,可以直接在线提交简历 * 新闻文章模块,可自由设置二级文章分类,并对每个分类使用不同模板,如定制某个文章分类为图片分类,视频分类等 * 扩展功能包含公告、留言、友情链接等 把本系统解压到网站根目录即可使用 后台管理目录: 该方法稳定兼容 Selenium 4.x,适用于各类基于 承载图片预览链接的 DOM 结构,是图像资源批量采集的基础实践方案。from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 假设 driver 已初始化(例如:driver = webdriver.Chrome())
# 确保页面已加载完成,推荐显式等待目标 div 出现
wait = WebDriverWait(driver, 10)
goods_div = wait.until(
EC.presence_of_element_located((By.CLASS_NAME, "goods_descr_images"))
)
# 查找该 div 下所有 标签
a_elements = goods_div.find_elements(By.TAG_NAME, "a")
# 提取每个 的 href 属性(即图片链接)
image_links = [a.get_attribute("href") for a in a_elements if a.get_attribute("href")]
# 去重(可选,因示例 HTML 中存在重复链接)
unique_links = list(dict.fromkeys(image_links))
print("共提取到", len(unique_links), "个唯一图片链接:")
for idx, link in enumerate(unique_links, 1):
print(f"{idx}. {link}")









