Sublime Text 查找替换默认使用 Python re 引擎,不支持 PCRE 高级特性;查找用 \1 引用捕获组,替换必须用 $1;跨行需启用 . matches newline;中文/emoji 推荐用 Unicode 范围匹配。

Sublime Text 正则查找框默认不启用 PCRE,需手动开启
Sublime Text 的查找(Ctrl+F)和替换(Ctrl+H)面板默认使用的是 Python 的 re 模块语法,但**不支持 PCRE 风格的命名捕获组、条件断言等高级特性**。如果你复制了其他编辑器(如 VS Code)的正则表达式却匹配失败,大概率是语法兼容性问题。
确认是否启用正则模式:点击查找面板右下角的 .* 图标(亮起即开启)。它只是开关,不是引擎切换开关——Sublime 用的就是 Python re,不是 Perl 或 JavaScript 引擎。
- 不支持
(?P以外的命名组写法(比如...) (?'name'...)或(?)...) - 不支持
(?(condition)yes|no)条件表达式 -
\K重置匹配起点 —— 完全不支持,别试 - 反向引用必须用
\1、\2,不能用$1(替换时除外,见下文)
替换时用 $1、$2 而不是 \1、\2
这是最常踩的坑:查找时用 \1 引用捕获组,但**替换字段里必须用 $1、$2**,否则 Sublime 会把 \1 当作字面量字符串处理,原样输出。
例如:想把 func(a, b) 替换为 func(b, a)
查找:func\(([^,]+),\s*([^)]+)\) 替换:func($2, $1)
- 错:替换写成
func(\2, \1)→ 输出字面量\2和\1 - 对:必须用
$1/$2,且不能加反斜杠转义(\$1会输出$1字符) - 如果要输出字面量
$,写成$$(双美元符号)
跨行匹配必须显式启用 DOTALL(即 . 匹配换行)
默认情况下,. 不匹配换行符。想匹配多行内容(比如注释块、HTML 标签对),不能只靠 [\s\S] 这种“土办法”——虽然能用,但低效且可读性差。
正确做法:在查找框左下角勾选 . matches newline(对应 Python 的 re.DOTALL 标志)。
- 开启后,
foo.*bar可以跨行匹配从foo到bar之间的所有内容(含换行) - 未开启时,
.*在遇到换行就停止,哪怕你写了[\s\S]*,也得小心空格/制表符遗漏 - 注意:开启后
^和$仍只匹配每行首尾,不是整个文本首尾;如需全文首尾,用\A和\Z
查找中文、emoji 或 Unicode 字符要避免编码陷阱
Sublime Text 本身支持 UTF-8,但正则引擎对 Unicode 的处理依赖于 Python 版本(Sublime 3 基于 Python 3.3+,Sublime 4 是 3.8+),所以基本没问题。真正容易出错的是:你在文件里看到的是中文,但复制进查找框时可能混入不可见字符(如零宽空格、BOM、全角空格)。
- 查中文时,建议先用
\u4e00-\u9fff显式写范围,比直接粘贴更可靠(尤其处理 OCR 或网页抓取文本时) - emoji 用
\U0001F600-\U0001F64F等 Unicode 范围更稳,直接输入 emoji 有时因字体渲染或剪贴板污染导致匹配失败 - 如果匹配结果总少一两个字符,检查是否启用了
Match Whole Word或Case Sensitive,它们会影响 Unicode 大小写判断(如某些带变音符号的字母)
复杂点在于:正则本身没问题,但你的文本来源(比如从微信、PDF、旧系统导出)可能带混合编码残留,这时候得先用编码转换工具清洗,再进 Sublime 处理。正则救不了脏数据。










