掌握正则表达式高级特性可提升字符串处理效率。1. 捕获组(())保存匹配内容,非捕获组(?:)仅分组不保存;2. 正向/负向前瞻(?=、?!)和后瞻(?<=、?<!)用于条件断言不占用匹配结果;3. 贪婪匹配尽可能多,懒惰模式(加?)优先满足最小匹配;4. 回溯引用(\1)复用捕获内容,命名捕获(?<name>)增强可读性。组合使用可精准解析复杂文本结构。

JavaScript中的正则表达式不仅仅是简单的文本查找工具,掌握高级模式匹配技术能显著提升处理字符串的效率和灵活性。通过合理使用分组、断言、懒惰匹配等特性,可以精准提取或替换复杂结构的数据。
捕获与非捕获分组
分组是正则中常用的技术,使用括号 () 可以创建一个捕获组,匹配的内容会被保存下来供后续引用。
- 捕获组示例:/(\d{4})-(\d{2})-(\d{2})/ 能分别捕获年、月、日 - 在 replace 中可通过 $1, $2, $3 引用捕获内容 - 若仅需分组但不保存结果,使用非捕获组:(?:...) - 例如:/(?:https?|ftp):\/\/(.+)/ 匹配 URL 协议但不单独捕获前瞻与后瞻断言(Lookahead and Lookbehind)
断言用于指定某个位置前后必须(或不能)出现的内容,但不包含在匹配结果中。
- 正向前瞻:(?=...),如 /\w+(?=@)/ 匹配 @ 前的用户名 - 负向前瞻:(?!...),如 /\d+(?!px)/ 匹配不是 px 结尾的数字 - 正向后瞻:(?<=...),如 /(?<=\$)\d+/ 匹配 $ 后的金额 - 负向后瞻:(?<!...),如 /(?<!-)\d+/ 匹配前面不是负号的数字懒惰匹配与贪婪匹配
默认情况下,量词如 *、+ 是贪婪的,会尽可能多地匹配。在量词后加 ? 可切换为懒惰模式。
立即学习“Java免费学习笔记(深入)”;
- 贪婪示例:/<.*>/ 会匹配从第一个 < 到最后一个 > 的全部内容 - 懒惰修正:/<.*?>/ 每遇到第一个 > 就停止,适合提取多个标签 - 实际应用:解析 HTML 片段时,/<div.*?>(.*?)<\/div>/ 可逐个提取 div 内容回溯引用与命名捕获
回溯引用允许在正则中引用前面捕获组的内容,命名捕获则让分组更易读和维护。
- 回溯引用:/(['"]).*?\1/ 匹配成对的单引号或双引号字符串 - 命名捕获组:/(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/ - 匹配后可通过 match.groups.year 获取年份,提高代码可读性基本上就这些核心技巧。灵活组合这些模式,就能应对大多数复杂的文本处理需求,比如日志解析、数据清洗或模板匹配。关键是理解每种机制的行为边界,避免过度匹配或性能问题。










