substr_replace() 是 php 中最直接的字符串指定位置插入方法,需将第四个参数设为 0;处理多字节字符时应使用 mb_substr() 拆分拼接,并显式指定 utf-8 编码。

用 substr_replace() 在字符串指定位置插入内容
PHP 没有原生的“在第 N 个字符后插入”函数,substr_replace() 是最直接、最可控的选择。它本质是「替换一段空字符串」,但效果就是插入。
常见错误是传错第四个参数(长度):设成 0 才表示“不删任何字符,只插入”;设成正数就会先删掉对应长度再插入,容易误删。
- 插入位置从
0开始计数(和substr()一致) - 第三个参数(长度)必须为
0,否则不是插入而是替换 - 第二个参数(新内容)可以是空字符串,但通常不是你想要的
示例:在字符串 "abcde" 的第 2 个字符后(即索引 2 处,c 前)插入 "X":
echo substr_replace("abcde", "X", 2, 0); // 输出 "abXcde"
用 mb_substr_replace() 处理中文或 emoji
如果字符串含中文、日文、emoji 或其他多字节字符,substr_replace() 会按字节切分,导致乱码或截断。这时候不能硬套,得用多字节安全方式。
立即学习“PHP免费学习笔记(深入)”;
PHP 没有内置的 mb_substr_replace(),但可以用 mb_substr() 拆 + 拼接模拟:
- 先用
mb_substr($str, 0, $pos, 'UTF-8')取前半段 - 再用
mb_substr($str, $pos, null, 'UTF-8')取后半段(null表示取到末尾) - 拼接:
$left . $insert . $right - 务必显式指定编码,如
'UTF-8',否则默认可能不是 UTF-8
示例:在 "你好world" 的第 2 个汉字后(即索引 2)插入 "_":
$str = "你好world";<br>$pos = 2;<br>$left = mb_substr($str, 0, $pos, 'UTF-8');<br>$right = mb_substr($str, $pos, null, 'UTF-8');<br>echo $left . "_" . $right; // 输出 "你好_world"
别用 str_replace() 或正则“模拟插入”
有人想用 str_replace() 替换第一个字符、或用 preg_replace() 配合 ^.{N} 来“锚定位置”,这非常危险。
问题在于:它们依赖内容匹配,不是位置控制。一旦目标字符串里有重复字符或特殊符号,结果完全不可控。
-
str_replace("a", "Xa", $s)会把所有a都插一遍,不是只插第 N 个位置 -
preg_replace('/^(.{2})/', '$1X', $s)看似可行,但.在非u模式下不认中文,且无法处理换行等边界情况 - 正则还引入回溯风险,长字符串可能超时
除非你在处理固定格式的模板(比如 XML 标签之间),否则纯位置操作请远离正则和模糊替换。
注意字符串偏移和编码的实际表现
PHP 字符串是字节数组,substr_replace() 的位置参数是字节偏移,不是字符偏移。这点在调试时特别容易被忽略。
比如 "café"(带重音符号的 e),在 UTF-8 下是 5 字节:c a f é → 63 61 66 C3 A9。如果你用 substr_replace($s, "X", 4, 0),实际插在 C3 和 A9 之间,会把 é 拆开,输出乱码。
- 用
strlen()看的是字节数,mb_strlen()看的是字符数,二者在中文/emoji 场景下一定不同 - 调试时用
bin2hex()看真实字节流,比肉眼数字符靠谱得多 - 如果业务中字符串来源不确定(比如用户输入、API 返回),默认按多字节逻辑处理更安全
位置计算出错,后面所有操作都白搭。宁可多调一次 mb_strlen(),也别信直觉数的“第几个字”。











