PHP正则核心是preg_*函数,关键在模式写法、函数行为与返回值配合:preg_match提取首个匹配,preg_match_all批量提取,preg_replace智能替换,preg_split按规则分割。

PHP 正则表达式核心靠 preg_* 系列函数,最常用的是 preg_match、preg_match_all、preg_replace 和 preg_split。掌握它们的关键不是死记语法,而是理解「模式写法 + 函数行为 + 返回值含义」三者的配合。
基础匹配:用 preg_match 提取第一个符合规则的内容
preg_match 只找第一次匹配,适合判断是否存在或提取关键字段。注意它返回的是匹配结果数量(0 或 1),不是匹配内容本身;匹配内容通过引用参数 $matches 获取。
- 模式必须用分隔符包裹,如
/\d+/或#\w+#,常用斜杠 - 末尾可加修饰符,比如
i(忽略大小写)、u(支持 UTF-8 中文) - 第三个参数
$matches是数组,$matches[0]是完整匹配,$matches[1]是第一个捕获组
示例:从字符串中提取邮箱
php$text = "联系我:admin@example.com 或 support@site.cn";
if (preg_match('/[\w.-]+@[\w.-]+\.\w+/', $text, $matches)) {
echo "找到邮箱:" . $matches[0]; // 输出 admin@example.com
}
?>
批量提取:用 preg_match_all 拿到所有匹配项
当要抓取多个同类内容(如所有链接、所有标签、所有数字),就用 preg_match_all。它返回匹配总数,并把结果按组填入 $matches —— 默认是“列优先”结构,即 $matches[0] 是所有完整匹配,$matches[1] 是所有第一个括号里的内容。
立即学习“PHP免费学习笔记(深入)”;
- 加
PREG_SET_ORDER标志可改成“行优先”,每项是一个完整匹配的子数组,更易遍历 - 中文文本务必加
u修饰符,否则可能乱码或截断
示例:提取 HTML 中所有图片地址

';preg_match_all('/
// $matches[1] 就是所有 src 的值:['a.jpg', 'b.png']
?>
替换与清理:用 preg_replace 做智能文本处理
preg_replace 把匹配到的内容替换成指定字符串,支持反向引用(如 $1 表示第一个捕获组),非常适合格式转换和敏感词过滤。
- 替换内容里用
$1、$2引用括号捕获的内容,注意是美元符号不是反斜杠 - 如果只是想删除匹配部分,替换为空字符串
''即可 - 批量替换全部匹配项,无需循环;加
limit参数可限制最多替换几次
示例:把手机号中间四位替换成星号
$phone = "13812345678";$masked = preg_replace('/(\d{3})\d{4}(\d{4})/', '$1****$2', $phone);
// 结果:138****5678
?>
分割字符串:用 preg_split 按复杂规则切开文本
比 explode 更灵活,能用正则定义“在哪里切”,比如按多个空格、标点、或特定标签分割,还能保留分隔符本身(加 PREG_SPLIT_DELIM_CAPTURE)。
- 默认会过滤掉空字符串,加
PREG_SPLIT_NO_EMPTY可避免意外丢数据 - 若分隔符有捕获组,且用了
PREG_SPLIT_DELIM_CAPTURE,分隔符也会出现在结果数组中
示例:按中文标点或空白字符分割句子
$text = "你好,世界!今天 天气不错。";$parts = preg_split('/[\s,。!?;:、\x{3000}]+/u', $text, -1, PREG_SPLIT_NO_EMPTY);
// 结果:['你好', '世界', '今天', '天气不错']
?>
基本上就这些。正则不是越复杂越好,先写准模式,再选对函数,最后检查 $matches 结构和返回值类型 —— 不复杂但容易忽略。











