mysql中处理字符串的关键函数有trim、replace、substring和concat。1. trim用于清除字段两端空格,如update users set name = trim(name),还可指定清除左或右空格;2. replace用于替换错误内容,如替换电话号码中的分隔符或去掉html标签;3. substring截取特定位置内容,left/right提取前几位或后几位,适用于身份证号、url参数等信息提取;4. concat用于简单拼接,concat_ws可加分隔符合并多个字段,自动跳过null值。这些函数在数据清洗中非常实用,组合使用能解决大部分文本问题。

在MySQL中处理字符串,尤其是做数据清洗时,掌握几个关键的字符串函数能让你事半功倍。这些函数不仅能帮你提取、替换、截取内容,还能有效清理脏数据,比如空格、非法字符或格式不统一的问题。
下面我挑几个最常用的字符串函数,并结合实际清洗场景说明它们怎么用。
1. TRIM:去掉多余空格,清理字段前后“隐形垃圾”
很多文本字段导入数据库后,前或后会带一些看不见的空格,影响查询和匹配。这时候用 TRIM() 函数就特别合适。
-
基本用法:
SELECT TRIM(' abc '); -- 返回 'abc' -
清洗应用:
- 清除字段两端空格:
UPDATE users SET name = TRIM(name);
- 还可以只清除左边或右边:
SELECT TRIM(LEADING ' ' FROM ' abc'); -- 去掉左边空格 SELECT TRIM(TRAILING ' ' FROM 'abc '); -- 去掉右边空格
- 清除字段两端空格:
这类操作对用户输入类的数据特别有用,比如注册表单中的用户名、邮箱等字段。
2. REPLACE:替换指定字符串,批量修复错误
当你发现某个字段里有错误内容,比如错别字、特殊符号或者多余的HTML标签,可以用 REPLACE() 批量替换。
-
基本用法:
SELECT REPLACE('hello world', 'world', 'MySQL'); -- 返回 'hello MySQL' -
实际清洗例子:
- 替换电话号码中的分隔符:
SELECT REPLACE(phone, '-', '') FROM contacts;
- 去掉HTML标签(假设字段存了带标签的内容):
UPDATE articles SET content = REPLACE(content, '
', '');
- 替换电话号码中的分隔符:
注意:这个函数是全字段替换,不能正则匹配。如果需要更复杂的替换,得配合其他工具或函数。
3. SUBSTRING 和 LEFT/RIGHT:截取部分内容,提取关键信息
有时候我们需要从一段字符串中提取特定位置的内容,比如身份证号里的出生年份、URL中的参数等。
10分钟内自己学会PHP其中,第1篇为入门篇,主要包括了解PHP、PHP开发环境搭建、PHP开发基础、PHP流程控制语句、函数、字符串操作、正则表达式、PHP数组、PHP与Web页面交互、日期和时间等内容;第2篇为提高篇,主要包括MySQL数据库设计、PHP操作MySQL数据库、Cookie和Session、图形图像处理技术、文件和目录处理技术、面向对象、PDO数据库抽象层、程序调试与错误处理、A
-
截取中间部分用
SUBSTRING():SELECT SUBSTRING('abcdefg', 3, 2); -- 从第3位开始取2个字符,返回 'cd' -
截取前几位或后几位可以用
LEFT()或RIGHT():SELECT LEFT('abcdefg', 3); -- 返回 'abc' SELECT RIGHT('abcdefg', 3); -- 返回 'efg' -
实际应用:
- 提取日期字段中的年份(假设格式固定):
SELECT SUBSTRING(birthday, 1, 4) AS year FROM users;
- 处理日志URL提取来源:
SELECT SUBSTRING(url, 8) FROM logs; -- 去掉开头 http://
- 提取日期字段中的年份(假设格式固定):
使用时要注意字段长度是否一致,避免截断出错。
4. CONCAT 和 CONCAT_WS:拼接字符串,整理字段组合
有些时候我们需要把多个字段合并成一个,比如地址字段拆成了省市区,想拼成完整地址。
-
简单拼接用
CONCAT():SELECT CONCAT(first_name, ' ', last_name) AS full_name FROM users;
-
加分隔符更方便的是
CONCAT_WS():SELECT CONCAT_WS(', ', 'Beijing', 'Shanghai', 'Guangzhou'); -- 返回 'Beijing, Shanghai, Guangzhou' -
数据清洗用途:
- 拼接地址字段:
SELECT CONCAT_WS(' ', province, city, district, street) AS full_address FROM addresses;
- 拼接地址字段:
遇到空值也不怕,它会自动跳过NULL字段,不会影响整体拼接结果。
这些字符串函数在日常数据清洗中非常实用,很多时候只要简单组合一下,就能解决大部分文本问题。像 TRIM 去空格、REPLACE 替换错误、SUBSTRING 提取信息、CONCAT 合并字段,都是经常需要用到的操作。
基本上就这些,不复杂但容易忽略细节的地方还是得多练多试。









