最简可靠方式是用 array_count_values() 统计频次,再用 array_filter() 筛出计数 ≥ 2 的键值对;若需原始键名,须配合 array_keys();单次遍历方案适用于超大数组以减少开销。

怎么找出 PHP 数组中出现次数 ≥ 2 的元素
直接用 array_count_values() 统计频次,再用 array_filter() 筛出计数 ≥ 2 的键值对。这是最简、最可靠的方式,不依赖排序,也不修改原数组顺序。
-
array_count_values()只接受索引数组或关联数组的值(不能有非标量值,否则报 Warning) - 筛选后得到的是「值 → 出现次数」的映射,如需原始键名,得配合
array_keys($arr, $value)多查一次 - 如果数组含
null、false、空字符串等松散相等的值,注意它们在统计时不会被合并(因为array_count_values()基于严格值比较)
保留所有重复项(含多次重复)的原始位置
单纯知道哪些值重复不够,有时需要提取所有重复值的完整副本(比如去重前先备份重复数据)。这时不能只靠 array_count_values(),得遍历 + 计数器。
- 用一个临时数组记录每个值首次出现的索引,第二次遇到就把它和当前索引一起存进结果
- 或者更直白:先跑一遍
array_count_values()得到频次表,再遍历原数组,对每个$v检查$counts[$v] >= 2,满足就[] = $v - 注意:关联数组的键会丢失,如需保留键,用
$result[$k] = $v赋值
性能敏感场景下避免两次遍历
当数组超大(比如 >10 万项),两次全量遍历(一次计数、一次筛选)会有明显开销。可改用单次遍历 + 条件收集:
- 初始化空数组
$seen和$duplicates - 遍历时,若
$v不在$seen中,存入$seen[$v] = true;否则,且$v还没进过$duplicates,就追加进去 - 这样每个重复值只进结果一次,且全程仅一次
foreach,内存占用也更低 - 缺点:无法得知具体出现几次,只保证「至少两次」
常见错误:用 array_unique() 反推重复项
有人想「去重后取差集」来反推重复值,比如:array_diff($arr, array_unique($arr)) —— 这是错的。
立即学习“PHP免费学习笔记(深入)”;
-
array_unique()返回的是去重后的值,但键名是原数组中首次出现的键,array_diff()比较时按键+值匹配,结果往往为空或混乱 - 即使看似有效,也依赖 PHP 版本对键的处理逻辑(如 7.4+ 对字符串键的 diff 行为有变化)
- 真正要反推,得用
array_keys(array_count_values($arr), 1, true)找出只出现一次的值,再用array_diff_key()排除,远不如直接筛 ≥2










