0

0

SQL 正则表达式与索引结合优化

舞夢輝影

舞夢輝影

发布时间:2026-02-23 21:10:02

|

391人浏览过

|

来源于php中文网

原创

mysql的regexp无法走索引,必须全表扫描;唯一能走索引的正则类操作是like 'abc%'前缀匹配;fulltext不支持正则;大数据量下应预提取可索引特征列替代正则查询。

sql 正则表达式与索引结合优化

MySQL 的 REGEXP 无法走索引,别硬扛

MySQL 原生 REGEXP(包括 RLIKE)在绝大多数情况下不会使用 B+ 树索引,哪怕字段上有 INDEXFULLTEXT。这不是配置问题,是引擎限制——它必须全表扫描逐行匹配。

常见错误现象:EXPLAIN 显示 type: ALLrows 等于全表行数、查询慢到超时;但开发者仍试图加 HINT 或调整 collation 挣扎。

  • 唯一能触发索引的“正则类”操作,仅限前缀匹配:LIKE 'abc%'(注意不是 '%abc''%abc%'
  • FULLTEXT 索引只支持 MATCH ... AGAINST,不支持正则语法,也不能写 REGEXP '.*pattern.*'
  • 如果必须用正则且数据量大,提前在应用层或 ETL 阶段把可索引特征提取为新列(比如 domain_partstatus_code),然后用等值或范围查询代替

PostgreSQL 的 ~~* 在某些条件下可走索引

PostgreSQL 支持为正则表达式构建函数索引,但前提是正则本身是「固定前缀」或能被 pg_trgm 扩展转化为相似度查询。它不像 MySQL 那样完全放弃索引,但也不是无脑生效。

使用场景:模糊查邮箱域名、日志行首模式、用户昵称关键词匹配(非任意位置)。

  • 启用 pg_trgmCREATE EXTENSION IF NOT EXISTS pg_trgm;
  • 建 GIN 索引:CREATE INDEX idx_users_email_trgm ON users USING GIN (email gin_trgm_ops);
  • 查询时用 ILIKE% 操作符才能命中索引,~* 表达式只有在简单字面量(如 email ~* '^admin@')且有函数索引时才可能走索引
  • 避免写 ~ '.*keyword.*' —— 这会退化为顺序扫描,pg_trgm.* 无感知

ClickHouse 的 match()extract() 能利用跳数索引

ClickHouse 不走传统 B+ 树,而是靠跳数索引(skip)和列式压缩特性加速正则。但前提是正则足够“具体”,能让引擎跳过大量数据块。

Dreamina
Dreamina

字节跳动推出的AI绘画工具,用简单的文案创作精美的图片

下载

性能影响明显:一个宽松的 match(url, 'https?://.*') 几乎没跳过效果;而 match(host, '^api\.[a-z]+\.com$') 可能跳掉 90% 的块。

  • 确保字段类型是 StringLowCardinality(String) 会破坏正则索引能力
  • 建表时显式声明跳数索引:INDEX idx_host host TYPE ngrambf_v1(4, 256, 2, 0) GRANULARITY 4
  • extract()match() 更重,只在真需要捕获子组时用;否则优先用 position() + substring() 组合替代
  • 避免在 WHERE 中嵌套多个 match(),它们无法合并跳过逻辑,会逐个检查

正则 + 索引的真正可行路径:预计算 + 约束条件下推

没有银弹。所有号称“SQL 正则走索引”的方案,本质都是把正则逻辑拆解成可索引的原子条件,再靠优化器合并执行。

容易被忽略的点:正则的语义复杂度越高,预计算列的维护成本就越大;而索引本身会拖慢写入,尤其高频更新场景。

  • 例如匹配手机号:phone REGEXP '^1[3-9]\d{9}$' → 提前加一列 is_mobile BOOLEAN,用触发器或应用层写入时计算
  • 再比如日志级别过滤:log_line ~ 'ERROR|FATAL' → 单独抽离 log_level String 列,用 ENUM 或字典映射
  • 千万别在 WHERE 里写 REGEXP 同时又依赖其他索引字段排序,优化器大概率放弃全部索引,改用临时文件排序

正则和索引天生不亲。想快,就得承认它不适合在线查询,要么降级为离线预处理,要么换工具——比如把匹配逻辑下推到向量化处理引擎(Doris、Trino)或专用文本引擎(Elasticsearch)里做。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1026

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

335

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

379

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1802

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

377

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1374

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

437

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1127

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
AngularJS教程
AngularJS教程

共24课时 | 3.8万人学习

【李炎恢】ThinkPHP8.x 后端框架课程
【李炎恢】ThinkPHP8.x 后端框架课程

共50课时 | 4.7万人学习

Swoft2.x速学之http api篇课程
Swoft2.x速学之http api篇课程

共16课时 | 1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号