array_merge + array_unique 会丢序且去重不彻底:数字键被重排、'1'与1被视为不同值;推荐手动展平+isset去重,或按字段用array_column+array_unique保序去重。

用 array_merge + array_unique 会丢序?
直接 array_merge(...$arr) 再 array_unique() 看似简单,但 PHP 7.4+ 的 array_unique() 默认保留**首次出现的键值对**,而 array_merge 展开后顺序取决于子数组遍历顺序——这本身没问题;真正掉坑的是:如果二维数组里有数字键,array_merge 会重排键名(比如 [0 => 'a'] 和 [0 => 'b'] 合并后变成 [0 => 'a', 1 => 'b']),看似保序,但一旦中间有空数组或非连续键,顺序就不可控。更关键的是,array_unique 对字符串和整数类型敏感,'1' 和 1 被视为不同值,去重不彻底。
推荐做法:foreach 手动展平 + isset 检查去重
最稳的方式是边展平边用临时数组记录已见值,靠 isset() 判断是否重复,天然保序且类型严格:
function flattenUnique($arr) {
$result = [];
$seen = [];
foreach ($arr as $sub) {
if (!is_array($sub)) continue;
foreach ($sub as $v) {
$k = is_scalar($v) ? (string)$v . '|' . gettype($v) : spl_object_hash($v);
if (!isset($seen[$k])) {
$seen[$k] = true;
$result[] = $v;
}
}
}
return $result;
}
- 用
(string)$v . '|' . gettype($v)区分1和'1',避免误判 - 对象用
spl_object_hash()标识,避免==引发的意外相等 - 跳过非数组子项,防 Warning
- 所有新值追加到
$result[],顺序完全由原二维结构遍历决定
要兼容 null / false / [] 怎么办?
上面的 isset() 对 null、false、空数组 [] 都返回 false,不能直接用于去重。此时必须改用 array_key_exists() 或更稳妥的 in_array($v, $result, true) ——但后者性能差。折中方案:
- 若数据量小(if (!in_array($v, $result, true)) { $result[] = $v; }
- 若含
null,可统一转成特殊标记,如$k = $v === null ? '__NULL__' : (string)$v . '|' . gettype($v) - 空数组
[]可用json_encode($v)作 key(注意深度嵌套会失效,仅限一维内元素)
array_column + array_unique 组合只适用于特定结构
如果你的二维数组其实是「记录列表」,比如 [ ['id'=>1,'name'=>'a'], ['id'=>2,'name'=>'a'] ],想按某个字段(如 name)去重并保序,那就别展平,直接用:
立即学习“PHP免费学习笔记(深入)”;
$names = array_column($data, 'name'); $unique_data = array_intersect_key($data, array_unique($names));
这行代码本质是:提取所有 name 值 → array_unique 保留首次出现的键 → 用 array_intersect_key 拿回原始数组对应位置的整行。它不去重整个二维结构,而是按字段筛选记录,速度快、语义清,但和「二维转一维」目标不一致——容易混淆,用前先确认需求到底是要扁平化,还是去重记录。
真正难的不是写几行代码,而是判断哪些值算“重复”:是字面量相等?类型也要一致?对象要不要深比较?这些决定了你该用 in_array(true)、序列化哈希,还是自定义比较函数。没想清楚这点,后面所有优化都是白搭。










