array_unique基于字符串转换后的哈希值去重,将元素强制转为字符串后以该字符串为键存入临时数组实现去重,导致1、"1"、1.0等被视作相同,且不支持多维数组、自定义比较或保留最后重复项。

array_unique 并不直接比较元素的“值是否相等”,而是基于字符串转换后的哈希值去重,这是它行为看似反直觉的根本原因。
去重原理:先转字符串,再用键名去重
PHP 内部实现大致是:遍历原数组,将每个元素 强制转换为字符串(使用 (string) 转换规则),然后以该字符串为键,存入一个临时关联数组。由于 PHP 关联数组的键必须唯一,重复的字符串键会自动覆盖,从而实现“去重”。最后返回这个临时数组的值(保持原始键名)。
这意味着:
- 数字 1 和字符串 "1" 会被视为相同 —— 因为 (string)1 === "1",(string)"1" === "1"
- 浮点数 1.0、整数 1、字符串 "1" 全部去重只剩一个
- null、false、0、"" 在字符串转换后都变成 "",也会被当作重复项
- 对象和资源无法被 string 转换为有意义的唯一标识,通常转成固定字符串(如 "Object" 或 "Resource id #N"),容易误判
不支持多维数组和自定义比较逻辑
array_unique 只能处理一维数组,且没有回调函数参数。遇到以下情况会失效或报错:
立即学习“PHP免费学习笔记(深入)”;
- 含子数组的数组:直接抛出 Warning(“Array to string conversion”),并把子数组转成字符串 "Array",导致多个子数组全被当成同一个元素
- 想按对象属性去重(如 user.id)、或忽略大小写去重字符串、或按数值精度比较浮点数——它完全做不到
- 需要保留最后出现的重复项(而非默认的第一个)?它也不支持
常见陷阱与替代方案
实际开发中,这些“理所当然”的操作可能翻车:
- 从数据库取数后去重 ID 列表,却混入了字符串 ID:比如 [1, 2, "3", "01"] → 去重后只剩 [1, 2, "3"]("01" 转字符串是 "01",不等于 "1",但若数据里有 "1" 就冲突)
- 用 array_unique 处理 API 返回的 JSON 解码数组,其中数字被当成字符串:需先 cast 类型再处理
- 想对对象数组去重:应手动提取唯一标识(如 array_column($users, 'id') → array_unique → 再用 array_intersect_key 还原)
- 需要更精准控制?改用 array_reduce + in_array(小数组) 或 维护一个已见集合(大数组) 手动遍历过滤
安全使用的建议
除非你明确知道数据类型纯净且符合字符串转换预期,否则不要无脑用 array_unique:
- 对数字 ID 列表,先用 array_map('intval', $arr) 或 array_filter($arr, 'is_numeric') 清洗
- 对字符串列表且需忽略大小写,先 array_map('strtolower', $arr) 再去重,或自己写循环 + strtolower + in_array
- PHP 8.1+ 可考虑 array_unique($arr, SORT_REGULAR) —— 它改用值比较(非字符串),能更好区分 1 和 "1",但仍不支持回调
- 永远检查输入类型;不确定时,加 var_dump(array_map('gettype', $arr)) 看一眼











