SQL 正则表达式在 SQL 中应用

舞夢輝影

发布时间：2026-02-24 21:24:57

650人浏览过

来源于php中文网

原创

mysql 8.0+ 支持 pcre 风格正则但需注意：不支持 /(?i)abc/ 等修饰符写法，大小写用 collate 控制；仅 8.0.22+ 支持；捕获组可用于过滤但不可直接引用；regexp 与 rlike 等价，否定用 not regexp。

sql 正则表达式在 sql 中应用

MySQL 8.0+ 的 `REGEXP` 和 `RLIKE` 怎么写才不报错

MySQL 在 8.0 之前只支持基本正则（POSIX ERE），8.0 起才用 ICU 库支持 PCRE 风格子组、懒匹配等特性——但默认仍禁用部分高级语法。常见错误是直接照搬 JavaScript 或 Python 正则，比如写 /(?i)abc/ 或 word，结果报错 Got error 'repetition-operator operand invalid' from regexp。

实操建议：

天龙企业网站管理系统 2008.net

天龙企业网站管理系统，基于.net2.0+access开发，系统架构采用MVC设计模式，是一个十分优秀的.net企业管理系统。其中包括产品发布，新闻发布，企业简价，企业文化，下载中心，客户留言等功能。在V2.0 sp2 基础上再次升级: 1、修正了前台的投票调查功能。 2、增强系统安全性，增加了防SQL注入功能 3、修补了后台漏洞 4、增加了前台游客留言的字符过滤，自动过滤html格式以增强系统安

下载

REGEXP 和 RLIKE 完全等价，选哪个纯看团队习惯；NOT REGEXP 才是否定形式，别写成 ! REGEXP
MySQL 不支持修饰符写在正则字面量里（如 /(?i)abc/），必须靠函数或上下文控制：大小写敏感用 COLLATE utf8mb4_0900_as_cs，否则默认不区分大小写
单词边界在 MySQL 8.0.22+ 才支持，低版本得用 [[:<:>:]]</:>（已废弃）或绕开：比如 CONCAT(' ', col, ' ') REGEXP ' abc '
捕获组可用，但不能在 SELECT 中直接引用（不像 PostgreSQL 的 REGEXP_MATCHES），只能用于条件过滤或配合 REGEXP_SUBSTR

PostgreSQL 的 `~`、`~*` 和 `regexp_replace()` 参数陷阱

PostgreSQL 正则最常踩的坑不是语法，而是参数顺序和空值处理：regexp_replace(text, pattern, replacement) 的第四个参数 flags 是可选字符串，但一旦传了就必须是 'g'（全局）、'i'（忽略大小写）等字母组合，不能带空格或逗号，写成 'gi' 对，'g,i' 就直接报错 syntax error at or near ","。

实操建议：

~ 区分大小写，~* 不区分，别混淆成 LIKE 的语义；!~ 和 !~* 是否定形式
regexp_replace() 默认只替换第一个匹配，要全局替换必须显式加 'g' 标志，漏掉就只修第一处
替换字符串里不能直接写引用捕获组，得用 \1（两个反斜杠），因为 SQL 字符串先解析一次转义
如果被匹配字段可能为 NULL，整个表达式会返回 NULL，需要提前用 COALESCE(col, '') 处理

SQL Server 没有原生正则？用 `LIKE` 和 `STRING_SPLIT` 替代的边界在哪

SQL Server 直到 2022 版才通过 TRANSLATE + STRING_AGG 组合勉强模拟简单正则逻辑，但真要匹配邮箱、手机号或提取数字片段，LIKE 的 % 和 _ 远不够用。这时候硬上 CLR 或外部脚本反而更慢，不如把清洗逻辑前置到应用层。

实操建议：

LIKE '[0-9][0-9][0-9]' 只能匹配固定长度数字，无法处理 12345 这种变长场景；CHARINDEX + SUBSTRING 拼凑效率低且难维护
SQL Server 2016+ 的 STRING_SPLIT 可拆分字符串，但返回无序结果，需配合 ROW_NUMBER() 才能定位第 N 个字段，不适合复杂模式提取
若必须在数据库内做，优先考虑 TRY_CAST 或 ISNUMERIC（注意后者对 '1e4' 也返回 1）做粗筛，再导出到应用层精筛
SQL Server 2022 的 REGEX_* 函数仍在预览阶段，生产环境别碰

Oracle 的 `REGEXP_LIKE` 为什么总多匹配一行

Oracle 默认按行匹配，但它的“行”定义依赖于输入数据里的换行符类型。如果字段值含 CHR(10)（LF）而客户端用的是 Windows 换行（CRLF），^ 和 $ 可能失效，导致 REGEXP_LIKE(col, '^abc$') 匹配到 'abc ' 这种带回车的值。

实操建议：

锚点 ^/$ 默认只匹配字符串首尾，不是每行首尾；要开启多行模式，必须加标志 'm'： REGEXP_LIKE(col, '^abc$', 'm')
Oracle 正则引擎对 Unicode 支持有限，d 只匹配 ASCII 数字，中文数字或全角数字得用 [0-9uFF10-uFF19]
REGEXP_SUBSTR 第三个参数是起始位置（从 1 开始），第四个是出现次数，容易和 PostgreSQL 的索引习惯搞混；第四个参数为 0 表示全部匹配，不是“第零次”
性能敏感场景下，先用 INSTR 快速排除明显不匹配的行，再对小结果集用 REGEXP_LIKE，避免全表扫正则

事情说清了就结束

SQL PostgreSQL 的 jit_above_cost / jit_optimize_above_cost 的 JIT 编译阈值实践

SQL MySQL 的 INFORMATION_SCHEMA.INNODB_SYS_TABLESPACES 的碎片率计算方法

SQL LEAD 与 LAG 函数使用技巧

SQL REGEXP_REPLACE 与数据清洗实践

SQL 函数索引在 WHERE 函数包裹列时的生效条件与示例模板

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 触发器日志与审计实现下一篇：SQL PostgreSQL 的 parallel_setup_cost / parallel_tuple_cost 的并行查询阈值调优

作者最新文章

研招网成绩查询入口2026 研招网官网入口官网

2026-02-24 11:36

国内yandex搜索引擎登录入口_yandexcom免登录入口

2026-02-24 11:36

无人机驾驶证报名入口官网

2026-02-24 11:44

艾诺迪亚4无限加点版下载_艾诺迪亚4无限能力点修改版下载

2026-02-24 11:46

腾讯会议屏幕大小设置方法

2026-02-24 11:51

GitHub 文件大小有限制吗？GitHub 文件上传与下载限制说明

2026-02-24 12:01

Python 对象生命周期管理与内存优化

2026-02-24 12:36

Linux 多用户环境下文件安全策略

2026-02-24 12:59

微信电脑版文件消失了微信电脑版文件丢失怎么办

2026-02-24 13:11

华为手机型号价目表华为主流机型价格对照

2026-02-24 13:35

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1027

2023.10.12