用 array_filter() 配合 stripos() 排除含某字符的项时,应回调中用 stripos($v, 'xxx') === false 判断「未找到」,避免 !strpos() 误判位置0;多禁用词用 preg_match() 正则匹配并转义元字符;中文等多字节字符须用 mb_stripos() 并指定 UTF-8 编码。

用 array_filter() 配合 stripos() 排除含某字符的项
直接用 array_filter() 是最常用也最稳妥的方式,关键在回调函数里判断是否「不含」目标字符串。注意别用 strpos(),它对大小写敏感;stripos() 更符合日常筛选需求(比如过滤掉所有含 "test" 或 "TEST" 的字符串)。
常见错误是写成 !strpos($v, 'xxx') —— 这会在匹配到开头(位置 0)时误判为 false,导致该项被错误剔除。
- 正确写法:用
stripos($v, 'xxx') === false明确判断「未找到」 - 如果要严格区分大小写,才换用
strpos(),但必须仍用=== false - 数组键名默认保留,如需重索引,外层套一层
array_values()
php
$items = ['apple', 'banana_test', 'cherry', 'TESTing'];
$result = array_filter($items, function($v) {
return stripos($v, 'test') === false;
});
// $result = ['apple', 'cherry']
批量筛选多个禁止字符?别嵌套 stripos(),改用 preg_match()
当要排除含「a」或「b」或「_」的项时,硬写多个 stripos() 判断既啰嗦又难维护。正则更清晰,且性能差异在常规数据量下可忽略。
注意点:preg_match() 默认是 PCRE,模式需加定界符(如 /.../i),i 修饰符实现不区分大小写,比手动转小写再查更省事。
立即学习“PHP免费学习笔记(深入)”;
- 避免写
preg_match('/a|b|_/', $v)后取反——逻辑易错,应直接让正则匹配「含任一禁用字符」,然后用!preg_match(...) - 若禁用字符含正则元字符(如
.、*、[),必须先用preg_quote()转义 - 空字符串或
null值传入preg_match()不会报错,但建议提前is_string()校验,尤其处理用户输入时
php
$forbidden = ['test', 'demo', '_tmp'];
$pattern = '/'.implode('|', array_map('preg_quote', $forbidden)).'/i';
$result = array_filter($items, function($v) use ($pattern) {
return !is_string($v) || !preg_match($pattern, $v);
});
foreach 手动遍历虽慢但可控,适合要同时做其他操作的场景
如果筛选过程中还要记录被剔除的项、统计原因、或根据内容动态调整规则,硬套 array_filter() 反而绕弯。这时候老老实实 foreach + unset() 或 array_push() 更直观。
性能上,foreach 比函数式写法略低,但除非数组超 10 万项,否则感知不到差别。真正要注意的是键名处理:
- 用
unset($arr[$k])后,原键名还在,只是值没了;后续foreach仍会遍历该键(值为null) - 推荐新建结果数组:
$filtered[] = $v;,天然重索引,语义也干净 - 如果必须保留原始键且不能有空洞,最后补一句
$filtered = array_filter($filtered);清掉 null 值(但通常没必要)
中文字符、emoji、多字节字符要用 mb_stripos() 替代 stripos()
遇到中文、日文、emoji 或带音调的字母(如 café),stripos() 会按字节匹配,极大概率出错。例如搜索「测试」可能匹配不上,因为 UTF-8 下一个汉字占 3 字节,stripos() 把它当 3 个独立 ASCII 字符看了。
解决方法很简单:把 stripos() 换成 mb_stripos(),并显式指定编码(通常是 'UTF-8')。不指定编码参数时,它依赖 mb_internal_encoding() 设置,线上环境容易不一致。
- 确认当前脚本编码是 UTF-8(文件保存格式 +
header('Content-Type: text/html; charset=utf-8');) - 所有涉及中文/多字节的字符串操作,优先查
mb_*函数族,别图省事用str_* -
mb_stripos()返回 int 或 false,判断逻辑和stripos()完全一致,替换成本很低
php
$result = array_filter($items, function($v) {
return mb_stripos($v, '测试', 0, 'UTF-8') === false;
});
实际项目里最容易漏的是多字节支持和正则元字符转义——尤其是从配置文件读取禁用词时,谁也不知道运营同事会不会填个 * 进去。











