0

0

PHP数组去重用array_unique够吗_PHP数组去重多种方法及效率对比【方法】

星夢妙者

星夢妙者

发布时间:2026-01-11 20:58:01

|

181人浏览过

|

来源于php中文网

原创

php数组去重有十种方法:一、array_unique函数;二、array_flip两次翻转;三、foreach配合in_array;四、array_keys与array_count_values组合;五、splfixedarray适用于超大整数数组;六、array_reduce累积去重;七、关联数组键值双维度去重;八、严格类型自定义回调;九、redis集合去重;十、generator流式去重。

php数组去重用array_unique够吗_php数组去重多种方法及效率对比【方法】

如果您在PHP开发中需要去除数组中的重复元素,array_unique函数看似直接有效,但其适用性取决于数组结构、数据类型及性能要求。以下是多种可行的去重方法及其具体操作步骤:

一、使用array_unique函数

array_unique函数适用于索引数组和关联数组,它依据值进行比较并保留第一个出现的键名,对字符串和数字类型处理稳定,但对多维数组或对象会失效。

1、定义原始数组:$arr = ['apple', 'banana', 'apple', 'cherry'];

2、调用函数:$result = array_unique($arr);

立即学习PHP免费学习笔记(深入)”;

3、重置索引(可选):$result = array_values($result);

二、使用array_flip两次翻转

该方法利用键名唯一性原理,先将值转为键,再翻转回值,适合纯数值或字符串的一维数组,且不保留原始键名,执行速度通常快于array_unique。

1、定义原始数组:$arr = ['a', 'b', 'a', 'c'];

2、第一次翻转:$flipped = array_flip($arr);

3、第二次翻转:$result = array_flip($flipped);

4、重置索引(可选):$result = array_values($result);

三、使用foreach配合in_array手动遍历

此方式完全可控,支持自定义比较逻辑(如忽略大小写、截取前缀等),适用于需条件过滤或复杂判断的场景,但时间复杂度为O(n²),大数据量时效率较低。

1、初始化空数组:$result = [];

2、遍历原数组:foreach ($arr as $value) {

3、判断是否已存在:if (!in_array($value, $result, true)) {

4、追加到结果数组:$result[] = $value;

5、闭合条件与循环:}}

四、使用array_keys与array_count_values组合

该方法通过统计频次后提取键名实现去重,天然保留所有唯一值,且可顺带获取各元素出现次数,适合需要频次信息的场景,对非标量值会触发警告。

1、定义原始数组:$arr = [1, 2, 2, 3];

2、统计频次:$counts = array_count_values($arr);

3、提取键名作为去重结果:$result = array_keys($counts);

五、使用SplFixedArray配合循环(适用于超大整数数组)

当处理百万级纯整数数组且内存敏感时,SplFixedArray可减少zval开销,配合布尔标记法实现线性时间去重,但仅限非负整数且需预估最大值范围。

1、确定数组最大值:$max = max($arr);

2、初始化固定数组:$seen = new SplFixedArray($max + 1);

3、遍历并标记:foreach ($arr as $val) { if ($val >= 0) { $seen[$val] = true; } }

4、收集结果:$result = []; for ($i = 0; $i getSize(); $i++) { if ($seen[$i] === true) { $result[] = $i; } }

六、使用array_reduce累积去重

该方法以函数式风格实现,适合嵌入管道式数据流处理,逻辑清晰但递归调用带来额外开销,对超大数组可能引发深度问题。

1、定义原始数组:$arr = ['x', 'y', 'x'];

2、调用array_reduce:$result = array_reduce($arr, function ($carry, $item) {

3、检查是否已存在:if (!in_array($item, $carry, true)) { $carry[] = $item; }

4、返回累积结果:return $carry; }, []);

七、针对关联数组的键值双维度去重

当需按多个字段(如name和email)联合判定重复时,array_unique无法直接处理,须序列化子数组或构造唯一哈希标识。

1、准备关联数组:$users = [['name'=>'A','email'=>'a@x.com'], ['name'=>'B','email'=>'a@x.com'], ['name'=>'A','email'=>'a@x.com']];

2、生成唯一标识:$hashes = array_map(function($u) { return $u['name'] . '|' . $u['email']; }, $users);

3、去重标识:$unique_hashes = array_unique($hashes);

4、映射回原数组:$result = array_intersect_key($users, $unique_hashes);

八、使用严格类型比较的自定义回调去重

PHP 7.4+支持在array_unique中传入SORT_FLAG_CASE等标志,但更灵活的方式是使用usort配合临时去重逻辑,尤其适用于浮点数容差比较或对象属性比对。

1、定义比较函数:$tolerance = 0.001; $compare = function($a, $b) use ($tolerance) { return abs($a - $b)

2、初始化结果数组:$result = [];

3、遍历原数组:foreach ($floats as $f) { $found = false; foreach ($result as $r) { if ($compare($f, $r)) { $found = true; break; } } if (!$found) $result[] = $f; }

九、使用Redis Set临时存储实现分布式去重

在高并发Web环境中,若需跨请求共享去重状态,可借助Redis的SADD命令原子性插入,避免单机内存限制,但引入外部依赖且不保证PHP数组原有顺序。

1、连接Redis实例:$redis = new Redis(); $redis->connect('127.0.0.1', 6379);

2、定义集合名:$setKey = 'unique:session:' . session_id();

3、逐个添加并捕获返回值:$uniqueItems = []; foreach ($arr as $item) { if ($redis->sAdd($setKey, $item) === 1) { $uniqueItems[] = $item; } }

4、设置过期时间(可选):$redis->expire($setKey, 3600);

十、使用Generator实现内存友好的流式去重

处理超大文件读取或数据库游标结果集时,避免一次性加载全部数据到内存,可通过生成器逐条判断并产出唯一项。

1、定义生成器函数:function uniqueGenerator($iterable) { $seen = []; foreach ($iterable as $item) { $key = is_object($item) ? spl_object_hash($item) : serialize($item); if (!isset($seen[$key])) { $seen[$key] = true; yield $item; } } }

2、调用生成器:$gen = uniqueGenerator($hugeDataSource);

3、遍历产出结果:foreach ($gen as $unique) { /* 处理唯一项 */ }

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

405

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

251

2023.10.07

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

336

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

224

2025.10.31

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

138

2026.02.12

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

846

2023.08.22

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

266

2025.12.04

session失效的原因
session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍:1、会话超时:服务器为Session设置了一个默认的超时时间,当用户在一段时间内没有与服务器交互时,Session将自动失效;2、会话数量限制:服务器为每个用户的Session数量设置了一个限制,当用户创建的Session数量超过这个限制时,最新的会覆盖最早的等等。

334

2023.10.17

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.3万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号