在Java中如何实现集合的去重操作_JavaSet应用说明

P粉602998670

发布时间：2026-01-30 11:47:09

489人浏览过

来源于php中文网

原创

用Set去重因时间复杂度O(1)优于手动遍历O(n²)，但自定义对象须重写equals和hashCode且保持一致；需保留插入顺序应选LinkedHashSet，TreeSet会排序失序；修改Set中对象影响hashCode的字段会导致查找失败。

在java中如何实现集合的去重操作_javaset应用说明

为什么用 `Set` 而不是手动遍历去重

因为 Set 接口的语义就是“不重复元素的集合”，底层实现（如 HashSet）通过哈希表自动处理重复判断，时间复杂度平均为 O(1)；而手动用 List 遍历 + contains() 判断，每次查找都是 O(n)，整体变成 O(n²)。尤其数据量稍大（比如 >1000 条），性能差距明显。

`HashSet` 去重的前提：对象必须正确重写 `equals()` 和 `hashCode()`

如果去重的是自定义对象（比如 User 类），只新建 HashSet 是没用的——默认继承 Object 的 hashCode() 返回内存地址，每个实例都不同，HashSet 就认为全是“新元素”。

必须确保：

逻辑上相等的对象，hashCode() 返回值必须相同
equals() 比较字段和 hashCode() 计算字段必须一致（比如都基于 id 和 name）
字段一旦加入 Set，就不应再修改影响 hashCode() 的值（否则可能再也找不到了）

public class User {
    private Long id;
    private String name;

    // 构造、getter 省略
    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        User user = (User) o;
        return Objects.equals(id, user.id) && Objects.equals(name, user.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(id, name); // 和 equals 用的字段完全一致
    }
}

保留插入顺序？用 `LinkedHashSet`，别用 `TreeSet`

TreeSet 虽然也能去重，但它按自然顺序或指定 Comparator 排序，**不保证原始插入顺序**。如果业务要求“去重但保持第一次出现的顺序”，必须选 LinkedHashSet。

立即学习“Java免费学习笔记（深入）”；

Flowith

一款GPT4驱动的节点式 AI 创作工具

下载

示例：

List<String> list = Arrays.asList("a", "b", "a", "c", "b");
Set<String> set = new LinkedHashSet<>(list); // ["a", "b", "c"]
// 不要写成 new TreeSet<>(list)，结果是 ["a", "b", "c"] 但靠字典序，且丢失原始位置信息

从 `List` 去重并转回 `List` 的安全写法

常见错误是直接 new ArrayList(new HashSet(list))——这会丢失顺序，且对自定义对象若没重写 equals/hashCode 会失效。

推荐做法（兼顾顺序、类型安全、可读性）：

简单类型（String, Integer 等）：用 LinkedHashSet 构造后再转 ArrayList
Java 8+：可用 Stream.distinct()，它依赖 equals()，也保持遇到顺序
注意：不要用 Collectors.toSet()，它返回的是无序 Set 实现（通常是 HashSet）

List<String> original = Arrays.asList("x", "y", "x", "z");
List<String> unique = new ArrayList<>(new LinkedHashSet<>(original));
// 或 Stream 版本：
List<String> unique2 = original.stream().distinct().collect(Collectors.toList());

实际项目里最容易被忽略的，是把可变对象（比如含未冻结字段的 DTO）塞进 Set 后又去修改其关键字段——这时候对象的 hashCode() 变了，但 Set 内部桶位置没更新，导致既查不到、也删不掉、还可能重复添加。

在Java里happens before规则的意义_Java并发顺序解析

如何在Java中使用泛型通配符_上下界? extends与? super的区别

Java 抽象类使用 abstract 关键字的语法与适用场景

Java do-while 循环在 JDBC 结果集处理中的应用场景

如何搭建Java的大数据环境_HDFS客户端API配置教程

相关标签:

java ai stream String Integer Object 继承接口对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：在Java中if条件语句怎么写_Java条件判断基础解析下一篇：在Java里注解是如何生效的_Java注解处理原理说明

作者最新文章

宝塔面板下数据库连接提示“太多连接数”该如何快速重置？

2026-03-16 17:17

Win11怎么隐藏任务栏_自动隐藏任务栏扩大显示区域

2026-03-16 17:18

Golang测试中的深度相等检查性能比较_reflect vs 专用库

2026-03-16 17:19

SQL如何统计各年龄段的人数分布_CASE WHEN与GROUP BY配合

2026-03-16 17:21

Win11怎么开启HDR模式_显示设置高动态范围视频开启

2026-03-16 17:21

Golang设计模式之备忘录模式 Go语言保存与恢复结构体历史状态

2026-03-16 17:22

如何在Golang中实现对象存储OSS上传 Go语言AWS S3 SDK集成

2026-03-16 17:22

Golang中的错误处理与事务回滚 Go语言数据库事务中的Err处理

2026-03-16 17:23

如何在Golang中利用Actor模型处理并发 Go语言Proto.Actor库简介

2026-03-16 17:24

如何在Golang中锁定依赖包的特定哈希值 Go语言go.sum文件详解

2026-03-16 17:25

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1071

2023.08.02

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

2007

2023.10.19