JavaScript中的正则表达式有哪些高级匹配技巧？-js教程-PHP中文网

掌握JavaScript正则高级技巧可提升文本处理效率：1. 分组捕获与反向引用（如/(w+)s+/）提取重复词；2. 零宽断言（(?=...)和(?<=...)）实现条件匹配不占位；3. 惰性匹配（*?）避免贪婪越界；4. 修饰符（g,i,m,s,u）增强灵活性，如/s匹配换行；5. 动态构造RegExp结合转义防注入，适用于高亮搜索。合理使用可高效应对复杂场景。

javascript中的正则表达式有哪些高级匹配技巧？

JavaScript中的正则表达式除了基础的匹配、替换和测试外，掌握一些高级技巧能大幅提升处理文本的效率和准确性。以下是几个实用且强大的高级匹配方法。

1. 分组捕获与反向引用

使用括号 () 可以创建捕获分组，提取匹配中的特定部分。在正则内部可通过 , 等进行反向引用，匹配之前分组的内容。

例如：匹配重复单词

/(w+)s+/g 可以匹配像 "hello hello" 这样的重复词，其中引用第一个分组的结果。

实际应用：

const text = "The the quick brown fox fox jumps"; console.log(text.replace(/(w+)s+/gi, "$1")); // 输出："The quick brown fox jumps"

2. 零宽断言（Lookahead 和 Lookbehind）

零宽断言用于指定某个位置前后必须满足某种条件，但不包含这些字符在匹配结果中。

立即学习“Java免费学习笔记（深入）”；

正向先行断言 (?=...)：

匹配后面紧跟特定内容的位置。

/Java(?=Script)/ 匹配 "Java" 仅当其后是 "Script"，如 "JavaScript" 中的 "Java"。

负向先行断言 (?!...)：

/Java(?!Script)/ 匹配 "Java" 后面不是 "Script" 的情况，比如 "Java is great" 中的 "Java"。

正向后行断言 (?（ES2018 支持）：

 匹配前面有美元符号的数字，如 "0" 中的 "100"。</p><div class="aritcle_card flexRow">
                                                        <div class="artcardd flexRow">
                                                                <a class="aritcle_card_img" href="/ai/1763" title="Khroma"><img
                                                                                src="https://img.php.cn/upload/ai_manual/000/969/633/68b6ceddca9b1981.png" alt="Khroma"  onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
                                                                <div class="aritcle_card_info flexColumn">
                                                                        <a href="/ai/1763" title="Khroma">Khroma</a>
                                                                        <p>AI调色盘生成工具</p>
                                                                </div>
                                                                <a href="/ai/1763" title="Khroma" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
                                                        </div>
                                                </div>

<font>负向后行断言 <strong>(?<!...)</strong>：</font>
<p><code/(?<!$)d+/

匹配前面没有 "$" 的数字，避免匹配价格。

3. 惰性匹配与贪婪匹配控制

默认情况下，量词如 *、+ 是贪婪的，尽可能多地匹配。加上 ? 变为惰性匹配。

例子：

从字符串 "<div>hello</div> <div>world</div>" 中提取每个 div 内容。

贪婪匹配：/<div>.*/ 会匹配整个字符串。 <p>惰性匹配：<code>/<div>.*?/ 可分别匹配两个 div 块。 <font>建议在提取标签或括号内容时优先使用惰性匹配，避免越界。</font> <h3>4. 使用修饰符提升灵活性</h3> <p>正则表达式支持多个修饰符，组合使用可增强功能。</p> <ul> <li> <strong>g</strong>：全局匹配，找到所有结果</li> <li> <strong>i</strong>：忽略大小写</li> <li> <strong>m</strong>：多行模式，^ 和 $ 匹配每行起止</li> <li> <strong>s</strong>：dotAll 模式，让 <strong>.</strong> 匹配换行符（ES2018）</li> <li> <strong>u</strong>：启用 Unicode 正确支持，处理 emoji 或特殊字符</li> </ul> <font>示例：匹配多行注释（含换行）</font> <p><code>//*[sS]*?*//gs 利用 [sS] 或开启 s 修饰符来跨行匹配。

现代写法：//*.*?*//gs 在支持 s 的环境中更清晰。

5. 动态构建正则表达式

使用 RegExp 构造函数可以动态插入变量，适合搜索高亮、关键词过滤等场景。

例子：高亮搜索词

function highlight(text, word) { const escaped = word.replace(/[.*+?^${}()|[]\]/g, '\$&'); const regex = new RegExp(`(${escaped})`, 'gi'); return text.replace(regex, '$1'); }

注意对用户输入进行转义，防止正则注入。

基本上就这些。灵活运用分组、断言、修饰符和动态构造，能让正则在复杂文本处理中游刃有余。关键是理解匹配机制，避免过度依赖正则处理结构化数据（如 HTML 解析）。