SQL如何按字节截取字符串_LEFT与RIGHT函数的字符集差异

P粉602998670

发布时间：2026-03-16 11:38:03

134人浏览过

来源于php中文网

原创

MySQL的LEFT()和RIGHT()按字符截取，而非字节；但若字段为VARBINARY类型或字符集不一致，会退化为字节截取，导致乱码或数据丢失。

sql如何按字节截取字符串_left与right函数的字符集差异

MySQL的`LEFT()`和`RIGHT()`按字节还是按字符截取？

按字符截取，不是字节——但前提是字符集是多字节时（比如utf8mb4），你得确认字段实际存储的是什么编码，否则看似“截对了”，实则丢数据。

这两个函数在MySQL里始终以“字符”为单位操作，不管底层是1字节的latin1还是3–4字节的utf8mb4。也就是说：LEFT('你好', 1)返回'你'，不是前1个字节（那会是乱码）。

常见错误现象：
• 在utf8mb4表中用LEFT(name, 10)做索引前缀，结果查不到预期记录 → 实际可能是前10个字符占了30+字节，而索引长度限制按字节算
• 把LEFT()结果直接拼进日志或URL，遇到emoji时被截成半个字符 → 显示或报错

使用场景：生成摘要、取文件名前缀、构造短标识符
参数差异：LEFT(str, len)中len是字符数，不是字节数；不支持负数长度
性能影响：纯内存计算，无IO开销，但若str是大字段（如TEXT），每次调用仍需加载完整值再截取

PostgreSQL里`LEFT()`和`RIGHT()`的行为完全不同

PostgreSQL没有内置LEFT()或RIGHT()函数，直接调用会报错：ERROR: function left(unknown, integer) does not exist。

必须用substring()或substr()模拟：

SELECT substring('hello世界', 1, 5); -- 返回 'hello'

注意：substring(str FROM start FOR len)里的start和len也都是字符位置，不是字节。PostgreSQL默认按Unicode字符计数，对emoji、中文、英文一视同仁。

Machine Translation

聚合多个来源的AI翻译

下载

容易踩的坑：误写LEFT(col, 5)导致SQL报错，尤其从MySQL迁移过来时
兼容性影响：如果应用层硬编码了LEFT()，换库时必须改SQL或加兼容函数
替代方案：left(str, len)可通过创建自定义函数实现，但需显式声明LANGUAGE sql并处理空值

想真正按字节截取？别碰`LEFT()`/`RIGHT()`

所有主流SQL引擎的LEFT()/RIGHT()都不提供字节级控制。真要按字节切（比如适配旧协议、拼接二进制头），得绕道：

MySQL：用SUBSTR(<code>col, 1, 10) + CONVERT(... USING latin1)强制转单字节编码（风险极高，会丢信息）
PostgreSQL：用convert_from(substring(col::bytea, 1, 10), 'UTF8')，但要求原字段是bytea类型
更安全的做法：把截取逻辑移到应用层，用Python/Go等语言的bytes切片，明确控制字节边界

典型错误现象：SUBSTR(col, 1, 10)在utf8mb4下截出半个emoji → 前端渲染失败或数据库报Incorrect string value

字符集设置如何悄悄影响`LEFT()`结果？

影响不在函数本身，而在字段定义和连接字符集。例如：

建表时用CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci，但客户端连接用SET NAMES latin1，这时LEFT(col, 5)拿到的其实是乱码后的字符序列，截取结果完全不可控。

检查方法：SHOW VARIABLES LIKE 'character_set%'; + SHOW CREATE TABLE t;
关键配置项：character_set_client、character_set_connection、character_set_database三者必须一致，否则函数输入已是失真字符串
最容易被忽略的一点：即使表和连接都设对了，如果字段是VARBINARY类型，LEFT()会按字节解释内容，此时行为突变 —— 它不再“按字符”，而是按原始字节流截取

所以别只盯着函数看，先盯住字段类型和三层字符集是否咬合。一个VARBINARY字段混在VARCHAR堆里，LEFT()就可能突然变成字节切割器，而且不会报错。

相关标签:

sql mysql String Integer for Error 标识符字符串堆 using 切片 len function table postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Oracle如何配置监听服务_listener.ora与tnsnames.ora解析下一篇：暂无

作者最新文章

Java中的SynchronousQueue有什么特点_容量为0的线程间直接握手传递通道

2026-03-16 09:55

Java基础如何手写一个简单的记事本程序_IO字符流读写与File类文件操作

2026-03-16 09:55

mysql如何备份表结构不包含数据_mysql --no-data参数

2026-03-16 09:56

如何在Golang中控制函数内联Inlining Go语言gcflags参数详解

2026-03-16 09:56

PostgreSQL在Navicat中如何修改已有表结构_高级特性支持

2026-03-16 09:57

怎么设置MongoDB客户端读取操作的过时容忍度_maxStalenessSeconds详解

2026-03-16 09:57

Navicat连Redis出现中文乱码怎么办_字符集编码调整

2026-03-16 09:57

如何配置Active Data Guard_备库实时查询与只读打开模式实现

2026-03-16 09:58

怎么优化远程服务器的开启备份文件加密保护_降低延迟与丢包率

2026-03-16 09:58

如何在Java接口中定义静态方法_工具方法的封装与调用规范

2026-03-16 09:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12