JavaScript正则表达式是RegExp对象,用于匹配、提取和替换文本;字面量写法为/pattern/flags;test()返回布尔值,match()返回匹配数组;replace()是否全局替换取决于g标志;需警惕灾难性回溯与环境兼容性。

JavaScript 正则表达式不是“一种字符串”,而是一个用于描述、匹配和操作文本模式的对象——它由 RegExp 构造函数或字面量(如 /abc/)创建,核心能力是「在字符串中查找、提取、替换符合特定规则的子串」。
怎样写一个能用的正则字面量?
最常用也最安全的写法是字面量形式:/pattern/flags。斜杠之间是模式主体,后面可跟标志(flag),比如 g(全局)、i(忽略大小写)、m(多行模式)。
常见错误现象:
- 忘记转义特殊字符:想匹配实际的点号
.,却写了/a.b/(这会匹配aXb),正确应为/a\.b/ - 误用 flag:比如只查一次却加了
g,后续调用exec()时因 lastIndex 残留导致匹配跳过或失败 - 在字符串拼接中用字面量:动态构造正则时不能直接拼
"/" + str + "/",必须用new RegExp(str)
RegExp.prototype.test() 和 String.prototype.match() 有什么区别?
test() 只返回布尔值,适合做条件判断;match() 返回匹配结果数组(含 index、input 等属性),适合提取内容。
立即学习“Java免费学习笔记(深入)”;
使用场景差异:
- 表单校验邮箱:用
/^[^\s@]+@[^\s@]+\.[^\s@]+$/.test(email)更轻量 - 从日志里提取时间戳:
logLine.match(/(\d{4})-(\d{2})-(\d{2}) (\d{2}:\d{2}:\d{2})/)能拿到分组 - 带
g标志时,match()返回纯匹配数组(无分组信息),此时若需捕获组,得用exec()循环调用
为什么 replace() 有时只换一次,有时全换?
取决于正则是否带 g 标志,以及传入的第二个参数类型。
关键细节:
-
"a a a".replace(/a/, "b")→"b a a"(无g,只替换第一个) -
"a a a".replace(/a/g, "b")→"b b b"(有g,全部替换) - 用函数作替换值时,函数参数顺序固定:
(match, p1, p2, offset, string),其中p1、p2是捕获组内容 - 注意:字符串作为替换值时,
$1、$2表示捕获组,但它们是字面字符串,不是变量——"x1y".replace(/(\d)/, "[$1]")→"x[1]y"
性能与兼容性要注意什么?
正则本身不慢,但滥用回溯、嵌套量词或超长输入会导致「灾难性回溯」,让 JS 主线程卡死。
容易被忽略的点:
-
.*在非贪婪模式下仍是潜在风险源,尤其配合后续可选匹配时(如/a.*?b.*?c/遇到不满足的字符串可能尝试指数级路径) -
RegExp实例不要在循环里反复创建(如for (...) { /abc/.test(s); }),应提前定义常量 - 某些老环境(如 IE8)不支持
u(Unicode)或y(粘性)标志,用前需检测或降级 - 现代写法倾向用
String.prototype.replaceAll()替代replace(/.../g, ...),但注意它只接受字符串或RegExp,且不支持函数回调中的捕获组引用
真正难的从来不是写出一个能跑的正则,而是预判它在边界输入下的行为、回溯深度、以及跨环境的一致性——调试时多看 RegExp.lastIndex 和浏览器开发者工具里的「正则测试器」,比背语法更重要。











