0
0
mysql 查询中文数据
我有张表数据量很大,name字段数据有中文的也有英文的,现在我想查出为中文的那些数据?
------解决方案--------------------
先规范一下说法:
这个"中文"虽然我们平时说意义很明确,不过到了电脑里就不那么清楚了....
utf8里中文汉字是和韩文日文汉字放一起的,统称cjk...其实还包括一些全角的符号...
utf8里汉字基本都在3字节区,有个别4字节的不过都是冷僻字,
同时,3字节区里还有印度字啊什么的...因为你不会用到,也就都不管它们...
所以我们简单化一点, 假设你是要找出所有带"3字节utf8字符"的记录
那么可以用这个
name regexp concat('[',char(0xE0),'-',char(0xEF),'][',char(0x80),'-',char(0xBF),'][',char(0x80),'-',char(0xBF),']')
注意\xXX这样的写法没法在mysql里的正则里直接用,所以要用char和concat....google一下没找到更方便的方法...
另外,不知道你数据里是否有2字节区的字符,(欧洲字符希腊字符拉丁字符等),
如果确定没有....确定!!!
就是说你数据里除了单字节的ascii字符,就是3字节的汉字....
那么可以用一个简单的方法:
char_length(name)!=length(name)
------解决方案--------------------
mysql 的 REGEXP不是很强大, 试试 [^[:alnum:][:cntrl:][:space:]]
我有张表数据量很大,name字段数据有中文的也有英文的,现在我想查出为中文的那些数据?
------解决方案--------------------
先规范一下说法:
这个"中文"虽然我们平时说意义很明确,不过到了电脑里就不那么清楚了....
utf8里中文汉字是和韩文日文汉字放一起的,统称cjk...其实还包括一些全角的符号...
utf8里汉字基本都在3字节区,有个别4字节的不过都是冷僻字,
同时,3字节区里还有印度字啊什么的...因为你不会用到,也就都不管它们...
所以我们简单化一点, 假设你是要找出所有带"3字节utf8字符"的记录
那么可以用这个
name regexp concat('[',char(0xE0),'-',char(0xEF),'][',char(0x80),'-',char(0xBF),'][',char(0x80),'-',char(0xBF),']')
注意\xXX这样的写法没法在mysql里的正则里直接用,所以要用char和concat....google一下没找到更方便的方法...
另外,不知道你数据里是否有2字节区的字符,(欧洲字符希腊字符拉丁字符等),
如果确定没有....确定!!!
就是说你数据里除了单字节的ascii字符,就是3字节的汉字....
那么可以用一个简单的方法:
char_length(name)!=length(name)
------解决方案--------------------
mysql 的 REGEXP不是很强大, 试试 [^[:alnum:][:cntrl:][:space:]]
相关文章
在PHP中读取文件的最后一行
在PHP中使用strchr()函数查找字符串
fgets()函数- 读取文件指向的行详解
strchr、str_replace、strpos函数使用详解
使用PHP和Chart.js创建多图表数据可视化应用程序
相关标签:
本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门AI工具
相关专题
C++ 设计模式与软件架构
本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。
14
2026.01.30
热门下载
最新文章








