如何使用正则表达式精准提取含特定类名的 HTML 标签内容

碧海醫心

发布时间：2026-01-05 15:16:22

256人浏览过

来源于php中文网

原创

如何使用正则表达式精准提取含特定类名的 HTML 标签内容

本文介绍在 php 中使用正则表达式安全、准确地提取 class 属性中包含指定关键词（如 "egg"）的 `` 标签内的文本内容，并提供可直接运行的代码示例与关键注意事项。

正确的思路是：定位标签结构本身，再捕获其内部内容。推荐使用以下正则表达式：

/<span class=".*?egg.*?">(.+?)<\/span>/

<span class="：字面量匹配起始标签前缀；
.*?egg.*?：非贪婪匹配任意字符（包括空格），确保 egg 作为子串出现在 class 值中（支持 class="egg"、class="egg ham"、class="scrambled-egg" 等）；
">：匹配属性结束与标签闭合的引号和 >；
(.+?)：核心捕获组，非贪婪匹配标签内任意内容（即目标文本）；
<\/span>：字面量匹配闭合标签（注意 / 转义）。

✅ 完整 PHP 示例（可直接运行）：

$text = 'I ate a <span class="egg">boiled egg</span> and <span class="ham">ham</span>. I ate a <span class="egg ham">ham and eggs</span>.';

preg_match_all('/<span class=".*?egg.*?">(.+?)<\/span>/', $text, $matches);

// $matches[1] 是第一个捕获组——即所有匹配的标签内容
if (!empty($matches[1])) {
    foreach ($matches[1] as $content) {
        echo trim($content) . "\n";
    }
}
// 输出：
// boiled egg
// ham and eggs

⚠️ 重要注意事项：

小羊标书

一键生成百页标书，让投标更简单高效

下载

立即学习“前端免费学习笔记（深入）”；

正则不适用于复杂 HTML：若 HTML 存在嵌套 、属性换行、注释或非法结构，正则易失效。生产环境强烈建议使用 DOM 解析器（如 DOMDocument + XPath）；
避免过度贪婪：务必使用 .*?（非贪婪）而非 .*，否则可能跨标签匹配；
转义字符：在 PHP 字符串中， 的 / 需转义为 <\/span>，或改用其他分隔符（如 #(.*?)#）；
编码与特殊字符：若内容含 HTML 实体（如 &），需额外调用 html_entity_decode() 处理；
性能考量：对超长文本频繁执行正则可能影响性能，建议结合缓存或预处理。

总结：该正则方案简洁高效，适用于结构清晰、可控的 HTML 片段提取场景。牢记“正则处理 HTML 有风险”，简单需求可快速落地，复杂场景请转向专业解析器。

Hyperf安装PHP扩展要求_Hyperf必要扩展安装汇总【技巧】

CodeIgniter在Mac上配置PHP扩展_CodeIgniterPHP扩展设置【详解】

宝塔面板下如何修改MySQL的字符集为utf8mb4支持表情？

PHP 数据库与缓存一致性设计

PHP代码复用有哪些方式_PHP include require trait对比【解答】

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php html 正则表达式编码正则表达式字符串 class dom

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：WooCommerce 中强制未登录用户重定向至登录页的正确实现方法下一篇：如何安全实现“记住我”功能：防止Cookie被恶意篡改的完整实践指南

作者最新文章

如何在桌面端调试移动设备触摸事件

2026-03-15 14:02

Camel SFTP 文件下载后如何避免重复拉取：正确配置文件处理策略

2026-03-15 14:04

如何在 Hibernate 中安全更新携带 ID 的分离实体

2026-03-15 14:07

如何实现侧边栏展开时主内容区域自适应剩余空间宽度

2026-03-15 14:12

苹果iPhone15怎么关闭APP自动更新

2026-03-15 14:14

PHP 数组按指定元素位置循环重排序教程

2026-03-15 14:20

如何在 Go 中正确构建并返回 JSON 响应

2026-03-15 14:24

如何实现点击模态框外部区域自动关闭功能

2026-03-15 14:29

Balkan FamilyTree JS：当前版本无法展开完整家谱树的官方说明

2026-03-15 14:35

如何让关闭按钮支持键盘操作（空格/回车触发）并符合无障碍标准

2026-03-15 14:50

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

531

2023.06.20

正则表达式不包含

正则表达式，又称规则表达式,，是一种文本模式，包括普通字符和特殊字符，是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章，希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

767

2023.07.05

java正则表达式匹配字符串

在Java中，我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容，帮助大家解决问题。

219

2023.08.11

正则表达式空格

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容，供大家免费下载体验。

357

2023.08.31

Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据，或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容，可以访问下面的文章。

245

2023.11.17

正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

549

2023.12.06

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

热门下载

网站特效

网站源码

网站素材

前端模板