word_limiter() 对中文无效,因其依赖空格分词而中文无此习惯;应改用 mb_substr() 并指定 utf-8 编码,或按字段类型明确区分截断策略。

word_limiter() 不是按字数截断,而是按单词数截断——传入中文时基本失效,这是它最常被误用的地方。
为什么 word_limiter() 对中文没用
这个函数底层用 preg_split() 按空白字符(空格、换行等)切分字符串,再取前 N 个单词拼回去。中文几乎不靠空格分词,所以整段文字常被当成“一个单词”,结果要么全留、要么全删。
常见错误现象:word_limiter('你好世界', 2) 返回完整字符串,或只返回第一个字(取决于原始字符串里有没有空格)。
使用场景仅适合英文、法文等空格分词语言;对中日韩越等语言,必须换方案。
中文场景下怎么安全截断文本
直接用 PHP 原生 mb_substr() 最稳,它支持多字节编码,能正确处理 UTF-8 中文。
- 确认当前环境已启用
mbstring扩展(CI3 默认依赖,CI4 已移除,需自行检查) - 明确指定编码:
mb_substr($str, 0, 50, 'UTF-8'),第三个参数不能省 - 如果要保留完整汉字并加省略号,得自己判断末尾是否截在字符中间:
mb_strlen($str) > 50 ? mb_substr($str, 0, 50, 'UTF-8') . '…' : $str - 别用
substr(),它会把中文字符切成乱码
想兼容中英文,又不想改太多代码怎么办
可以封装一个轻量替代函数,内部根据内容自动切换策略:
比如检测字符串里中文字符占比超过 30%,就走 mb_substr();否则走 word_limiter()。但注意:正则检测中文(如 /[\x{4e00}-\x{9fff}]/u)有性能开销,高频调用时不建议在循环里反复用。
更务实的做法是:业务层明确区分字段类型——标题用字数截断(mb_substr()),英文摘要用 word_limiter(),不混用。
真正麻烦的不是函数选错,而是模板里到处散落着未声明编码、未校验长度的 word_limiter() 调用——一旦数据含中文,表现就不可控。改之前先 grep 一遍项目里所有 word_limiter 的调用点。











