如何使用正则表达式匹配包含重复字母的字符串

霞舞

发布时间：2026-01-22 16:29:01

162人浏览过

来源于php中文网

原创

如何使用正则表达式匹配包含重复字母的字符串

本文介绍如何在 php 中使用 `preg_grep()` 和 unicode 感知正则表达式，精准筛选出**至少包含两个相同字母（任意字母）且非连续也允许间隔**的字符串，适用于去重检测、密码强度校验等场景。

要实现“匹配任意字母出现两次及以上（不强制相邻）”的需求，关键在于：不能硬编码具体字符（如 /a{2}/），而应使用捕获组 + 反向引用，并确保匹配的是真正的“字母”，而非任意字符（避免误匹配空格、数字或标点）。

推荐正则表达式：

'/(\p{L}).*\1/'

(\p{L})：匹配任意 Unicode 字母（如 a, B, é, 中），并捕获到第 1 组；
.*：匹配任意数量（含零个）的非换行符字符（贪婪匹配）；
\1：反向引用第 1 组捕获的完全相同的字母，确保二次出现的是同一个字符。

✅ 正确示例（匹配成功）：

"asds" → s 在位置 1 和 3 出现 → ✅
"dfaa" → a 在位置 2 和 3 出现（连续）→ ✅
"aabb" → a 出现两次（前两位）→ ✅
"aaabb" → a 出现三次 → ✅

⚠️ 注意事项：

闪念贝壳

闪念贝壳是一款AI 驱动的智能语音笔记，随时随地用语音记录你的每一个想法。

下载

原代码中 explode("\n", $input_lines) 是错误的：$input_lines 已是数组，无需 explode；直接对数组使用 preg_grep() 即可。
若需仅匹配 ASCII 字母（排除中文、带音调字母等），可改用 /([a-zA-Z]).*\1/；
若要求“至少两个相同字母且必须连续”，应使用 /([a-zA-Z])\1+/；
\p{L} 在 PCRE 中默认启用 UTF-8 模式，PHP 7.3+ 默认支持；若环境较旧，建议添加 u 修饰符：'/(\p{L}).*\1/u'。

完整可运行代码：

<?php
$input_lines = ["asdf", "fdas", "asds", "d fm", "dfaa", "aaaa", "aabb", "aaabb"];
$result = preg_grep('/(\p{L}).*\1/', $input_lines);
print_r($result);
// 输出索引为 2,4,5,6,7 的元素：asds, dfaa, aaaa, aabb, aaabb
?>

? 小结：该方案兼顾准确性与可扩展性——它不依赖预设字符集，天然支持多语言文本，并通过反向引用确保语义一致性。如需进一步限制最小重复次数（如“同一字母至少出现 3 次”），可结合 preg_match_all 或使用更复杂的回溯控制，但对绝大多数重复检测场景，/(\p{L}).*\1/ 已足够高效可靠。

Symfony和Laravel有什么区别_两大PHP框架选型对比【介绍】

PHP函数中动态生成HTML表单的正确实践

Laravel 中如何在数据库层面直接截取并更新字段值

PHP文件上传怎么做_PHP $_FILES处理上传文件【指南】

如何在 PHP 中从数据库查询结果中精准提取指定字段（如 username）

相关标签:

php 正则表达式编码多语言正则表达式字符串 ASCII

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Laravel Excel 导出多维数组数据的正确处理方法下一篇：如何在关联查询中对无日期字段的主表实现跨表联合筛选

作者最新文章

SQLModel 中处理时区感知 datetime 字段的正确方法

2026-03-12 14:35