最可靠方式是根据需求选择 strlen()(字节长度)或 mb_strlen($str, 'UTF-8')(字符长度),并严格预检输入类型与编码,避免隐式转换和环境依赖。

用 strlen() 判断字符串是否等于固定长度
PHP 中最直接、最可靠的方式就是用 strlen() 获取字节数,再与目标长度比较。它不解析编码,纯看字节,适合 ASCII 或已知 UTF-8 单字节字符为主的场景。
常见错误是误用 mb_strlen() 却没指定编码,导致中文返回 1(实际应为 3 字节)或结果不稳定;或者用 strlen() 处理含中文的 UTF-8 字符串却期望“字符数”而非“字节数”,结果对不上。
-
strlen("abc") === 3→ true(正确) -
strlen("你好") === 2→ false(实际是 6 字节,返回 6) - 若你要求“恰好 5 个汉字”,必须用
mb_strlen($str, 'UTF-8') === 5 - 若你要求“HTTP 请求体必须是 16 字节密钥”,
strlen()才是准确选择
用 mb_strlen() 按字符数精准匹配(UTF-8 场景)
当业务逻辑基于“用户看到的字符个数”(比如用户名限 10 个汉字、昵称最多 8 个 emoji),必须用 mb_strlen() 并显式传入 'UTF-8' 编码参数。否则在某些环境(如旧版 PHP 或非 UTF-8 default_charset)下可能 fallback 到 ISO-8859-1,导致中文全算作 1 字符。
- ✅ 正确写法:
mb_strlen($str, 'UTF-8') === 10 - ❌ 危险写法:
mb_strlen($str) === 10(依赖mb_internal_encoding(),不可控) - ⚠️ 注意:
mb_strlen()比strlen()稍慢,高频校验(如每秒万次密码字段)需权衡 - emoji、生僻汉字、组合字符(如 ??)均被正确计为 1 个字符
正则 ^.{N}$ 匹配固定字符数?慎用
有人用 preg_match('/^.{5}$/', $str) 判断长度,看似简洁,但默认点号 . 不匹配换行符,且不区分字节/字符——在 UTF-8 下,. 默认按字节匹配(PCRE 默认非 u 模式),遇到多字节字符会出错;加 u 修饰符后才按 Unicode 字符处理,但性能明显下降,且空字符串、null 输入易引发警告。
立即学习“PHP免费学习笔记(深入)”;
- ✅ 加
u且确保输入非 null:is_string($str) && preg_match('/^.{5}$/u', $str) - ❌ 不加
u:preg_match('/^.{2}$/', "你好")可能返回 1(错误匹配前两个字节) - ❌ 忽略类型检查:
preg_match()对null返回NULL,直接比较=== 1会逻辑失效 - 正则更适合复合规则(如“5 位字母数字”),单纯比长度不如
strlen()直观安全
边界情况:空字符串、null、非字符串类型怎么处理?
真实接口中,$_POST['name'] 可能是 null、''、0 或数组。直接扔给 strlen() 会触发 warning(null 转成空字符串),mb_strlen() 对非字符串返回 0,但语义错误——这不是“长度为 0 的字符串”,而是“根本不是字符串”。
- 统一预检:
!is_string($str) || !isset($str)应先拦截 - 空字符串
''的strlen('') === 0是合法值,是否允许取决于业务(如密码字段不允许空) - 避免隐式转换:
strlen(0)返回 1(数字 0 → 字符串 "0"),strlen(false)返回 0(false → ""),极易埋坑 - 建议封装小函数:
function strLength(string $s): int { return strlen($s); },靠类型声明堵住非字符串输入
=== 变成定时炸弹。特别是混合中英文+emoji 的表单,别图省事跳过 mb_* 的编码参数。











