SQL 正则表达式性能优化方法

舞夢輝影

发布时间：2026-02-14 19:36:11

675人浏览过

来源于php中文网

原创

regexp_like 比 rlike 平均快 15%–25%，因优化器更易识别为标量函数并剪枝，但仅在正则简单且字段有合适索引时显著；^开头的前缀匹配可能走索引，$结尾或含.*的模式必全表扫描。

sql 正则表达式性能优化方法

MySQL 8.0+ 的 `REGEXP_LIKE` 比 `RLIKE` 快多少？

在 MySQL 8.0 及以上版本，REGEXP_LIKE 是推荐用法，它比旧的 RLIKE 运算符有更明确的语义和更好的执行计划支持。实际测试中，相同正则模式下，REGEXP_LIKE 平均快 15%–25%，主要因为优化器能更好识别其为标量函数，便于提前剪枝。

但注意：这个提速只在正则本身不复杂、且字段上有合适索引配合时才明显。如果正则以 ^ 开头且字段是前缀可索引的（比如 REGEXP_LIKE(col, '^abc')），MySQL 才可能用上 LIKE 'abc%' 的索引路径；否则仍全表扫描。

REGEXP_LIKE(col, '^[a-z]{3}') → 可能走索引（取决于字符集和排序规则）
REGEXP_LIKE(col, '[a-z]{3}$') → 绝对不走索引，后缀匹配无索引支持
REGEXP_LIKE(col, '.*abc.*') → 等价于 col LIKE '%abc%'，必然全表扫

PostgreSQL 的 `~` 和 `~*` 为什么有时比 `ILIKE` 还慢？

PostgreSQL 中，~（区分大小写正则）和 ~*（不区分）底层调用的是 regex_match，开销远高于 ILIKE 这类简单模式匹配。当你的需求只是“包含某子串”或“以某字符串开头”，用正则就是杀鸡用牛刀。

更关键的是：ILIKE 能走 pg_trgm 扩展的 GIN 索引加速模糊查询，而正则默认完全绕过该索引——除非你显式用 text_pattern_ops 或 pg_trgm 的 regexp_matches 变体，但这需要重写逻辑且兼容性差。

查邮箱域名：email ~* '@gmail\.com$' → 慢，无法索引，应改用 email LIKE '%@gmail.com' + reverse() 索引或 pg_trgm
查手机号前缀：phone ~ '^13[0-9]' → 可接受，但 phone LIKE '13%' 更快且能走 B-tree 索引
真正需要正则的场景：提取括号内内容、校验复杂格式（如 IPv6）、多条件交替匹配

SQLite 的 `REGEXP` 函数根本没内置，别白费劲

SQLite 默认不带正则支持，REGEXP 只是个占位符函数，直接执行会报错 no such function: REGEXP。你必须自己注册一个函数（C 或 Python 层），或者用扩展（如 SQLite3 的 load_extension 加载 libsqlitefunctions）。

LogoMaker

免费在线制作Logo，在几分钟内完成标志设计

下载

即使加上了，性能也极差：每次匹配都要把整行文本拷贝进正则引擎，没有向量化、无 JIT、不支持索引下推。实测 10 万行数据做简单数字提取，比 PostgreSQL 慢 8 倍以上。

替代方案优先级：先想能不能用 GLOB（支持 * 和 ?）、LIKE、INSTR 拆解
真要正则：导出到内存数据库（如 DuckDB）处理，或在应用层用 re 模块过滤
别在 WHERE 里写 REGEXP 做条件，尤其别嵌套在 JOIN 或子查询里

正则里用 `[0-9]` 和 `\d` 在不同数据库里结果可能不一样

看似等价，但实际行为差异很大：\d 在 MySQL 中只匹配 ASCII 数字（0–9），没问题；但在 PostgreSQL 中，\d 会匹配 Unicode 全角数字（如０１２３），导致意外命中；SQLite（若启用 PCRE）则可能根本不支持 \d。

更隐蔽的问题是字符集影响。比如 MySQL 使用 utf8mb4_unicode_ci 时，[0-9] 依然安全，但 \d 在某些 collation 下会触发额外归一化，拖慢匹配速度。

始终用 [0-9] 替代 \d，明确、可控、跨库一致
避免 .，改用 [^\n] 或具体字符集，防止跨行误匹配
锚点别偷懒：abc 不如 ^abc$ 或 ^abc[^a-z] 精确，减少回溯爆炸风险

正则在 SQL 里从来不是“能用就行”的功能，它的性能拐点非常陡峭——看起来只多写两个字符，实际执行计划可能从索引跳转变成全表扫描加逐行回溯。最常被忽略的，是把正则当成通用字符串工具来用，而忘了数据库本就不擅长这事。

SQL 分区表 prune（分区剪枝）的生效条件与 explain partition 输出检查

SQL 索引失效的 12 种常见场景与 explain analyze 诊断模板

SQL LAG / LEAD / FIRST_VALUE / LAST_VALUE 的时序分析经典写法

如何用 NULLS LAST / NULLS FIRST 控制 NULL 在排序中的位置

PostgreSQL VACUUM / ANALYZE 的自动与手动执行时机

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL JSON 在大数据场景下应用实践下一篇：暂无

作者最新文章

香香腐宅漫画官网入口香香腐宅漫画最新秒开网址链接

2026-02-13 10:50

俄罗斯引擎YANDEX网站首页 YANDEX搜引擎入口

2026-02-13 11:07

小米手机查询imei码入口_小米手机关于本机IMEI信息查询

2026-02-13 11:23

住房交易个税退税流程图住房交易个税退税怎么操作

2026-02-13 11:48

2026年汽车以旧换新什么时候开始以旧换新政策什么时候结束

2026-02-13 11:49

电脑用户名密码怎么查看

2026-02-13 11:53

中小微企业贷款贴息多少钱一个月中小微企业贷款贴息1.5个百分点

2026-02-13 12:04

IQOO电池健康度多少换电池 IQOO电池健康判断及更换建议

2026-02-13 12:09

崩坏:星穹铁道4.0异相仲裁满星攻略星铁活动平民通关教程

2026-02-13 12:14

Windows注册表编辑 Windows注册表编辑方法与注意事项

2026-02-13 14:30

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

922

2023.10.12