0

0

SQL 正则表达式性能优化方法

舞夢輝影

舞夢輝影

发布时间:2026-02-14 19:36:11

|

675人浏览过

|

来源于php中文网

原创

regexp_like 比 rlike 平均快 15%–25%,因优化器更易识别为标量函数并剪枝,但仅在正则简单且字段有合适索引时显著;^开头的前缀匹配可能走索引,$结尾或含.*的模式必全表扫描。

sql 正则表达式性能优化方法

MySQL 8.0+ 的 REGEXP_LIKERLIKE 快多少?

在 MySQL 8.0 及以上版本,REGEXP_LIKE 是推荐用法,它比旧的 RLIKE 运算符有更明确的语义和更好的执行计划支持。实际测试中,相同正则模式下,REGEXP_LIKE 平均快 15%–25%,主要因为优化器能更好识别其为标量函数,便于提前剪枝。

但注意:这个提速只在正则本身不复杂、且字段上有合适索引配合时才明显。如果正则以 ^ 开头且字段是前缀可索引的(比如 REGEXP_LIKE(col, '^abc')),MySQL 才可能用上 LIKE 'abc%' 的索引路径;否则仍全表扫描。

  • REGEXP_LIKE(col, '^[a-z]{3}') → 可能走索引(取决于字符集和排序规则)
  • REGEXP_LIKE(col, '[a-z]{3}$') → 绝对不走索引,后缀匹配无索引支持
  • REGEXP_LIKE(col, '.*abc.*') → 等价于 col LIKE '%abc%',必然全表扫

PostgreSQL 的 ~~* 为什么有时比 ILIKE 还慢?

PostgreSQL 中,~(区分大小写正则)和 ~*(不区分)底层调用的是 regex_match,开销远高于 ILIKE 这类简单模式匹配。当你的需求只是“包含某子串”或“以某字符串开头”,用正则就是杀鸡用牛刀。

更关键的是:ILIKE 能走 pg_trgm 扩展的 GIN 索引加速模糊查询,而正则默认完全绕过该索引——除非你显式用 text_pattern_opspg_trgmregexp_matches 变体,但这需要重写逻辑且兼容性差。

  • 查邮箱域名:email ~* '@gmail\.com$' → 慢,无法索引,应改用 email LIKE '%@gmail.com' + reverse() 索引或 pg_trgm
  • 查手机号前缀:phone ~ '^13[0-9]' → 可接受,但 phone LIKE '13%' 更快且能走 B-tree 索引
  • 真正需要正则的场景:提取括号内内容、校验复杂格式(如 IPv6)、多条件交替匹配

SQLite 的 REGEXP 函数根本没内置,别白费劲

SQLite 默认不带正则支持,REGEXP 只是个占位符函数,直接执行会报错 no such function: REGEXP。你必须自己注册一个函数(C 或 Python 层),或者用扩展(如 SQLite3 的 load_extension 加载 libsqlitefunctions)。

LogoMaker
LogoMaker

免费在线制作Logo,在几分钟内完成标志设计

下载

即使加上了,性能也极差:每次匹配都要把整行文本拷贝进正则引擎,没有向量化、无 JIT、不支持索引下推。实测 10 万行数据做简单数字提取,比 PostgreSQL 慢 8 倍以上。

  • 替代方案优先级:先想能不能用 GLOB(支持 *?)、LIKEINSTR 拆解
  • 真要正则:导出到内存数据库(如 DuckDB)处理,或在应用层用 re 模块过滤
  • 别在 WHERE 里写 REGEXP 做条件,尤其别嵌套在 JOIN 或子查询里

正则里用 [0-9]\d 在不同数据库里结果可能不一样

看似等价,但实际行为差异很大:\d 在 MySQL 中只匹配 ASCII 数字(0–9),没问题;但在 PostgreSQL 中,\d 会匹配 Unicode 全角数字(如 0123),导致意外命中;SQLite(若启用 PCRE)则可能根本不支持 \d

更隐蔽的问题是字符集影响。比如 MySQL 使用 utf8mb4_unicode_ci 时,[0-9] 依然安全,但 \d 在某些 collation 下会触发额外归一化,拖慢匹配速度。

  • 始终用 [0-9] 替代 \d,明确、可控、跨库一致
  • 避免 .,改用 [^\n] 或具体字符集,防止跨行误匹配
  • 锚点别偷懒:abc 不如 ^abc$^abc[^a-z] 精确,减少回溯爆炸风险

正则在 SQL 里从来不是“能用就行”的功能,它的性能拐点非常陡峭——看起来只多写两个字符,实际执行计划可能从索引跳转变成全表扫描加逐行回溯。最常被忽略的,是把正则当成通用字符串工具来用,而忘了数据库本就不擅长这事。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

922

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

334

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

374

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1636

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

369

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1210

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

583

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

434

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

23

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
AngularJS教程
AngularJS教程

共24课时 | 3.6万人学习

【李炎恢】ThinkPHP8.x 后端框架课程
【李炎恢】ThinkPHP8.x 后端框架课程

共50课时 | 4.6万人学习

Swoft2.x速学之http api篇课程
Swoft2.x速学之http api篇课程

共16课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号