在Java里如何使用Set集合去除重复元素_Java去重操作解析

P粉602998670

发布时间：2026-01-24 13:41:02

707人浏览过

来源于php中文网

原创

HashSet去重失败的根本原因是对象未正确重写equals()和hashCode()；LinkedHashSet可保持插入顺序去重；distinct()依赖equals/hashCode且不支持字段级去重；SQL层去重优先于Java层。

在java里如何使用set集合去除重复元素_java去重操作解析

为什么直接用 `HashSet` 有时去重失败？

根本原因不是 HashSet 不行，而是你存的对象没正确重写 equals() 和 hashCode()。比如用自定义类 User 存进 HashSet，但没重写这两个方法，那两个字段完全相同的 User 实例仍会被视为不同元素——因为默认比较的是内存地址。

只重写 equals() 不重写 hashCode()：违反哈希契约，可能导致元素“消失”（contains() 返回 false，但实际存在）
字段参与比较的，必须全部出现在 hashCode() 计算中（推荐用 Objects.hash(...)）
使用 Lombok 的话，加 @EqualsAndHashCode 注解最省事，但要确认 exclude 或 of 指定的字段符合业务去重逻辑

如何对 List 快速去重并保持插入顺序？

用 LinkedHashSet 是最直接的方式：它既具备 HashSet 的去重能力，又通过链表维护插入顺序。

List<String> original = Arrays.asList("a", "b", "a", "c");
List<String> unique = new ArrayList<>(new LinkedHashSet<>(original));

注意：构造 LinkedHashSet 时传入原 List，会按遍历顺序去重；不能反过来先建空集再 addAll()，否则顺序可能错乱
如果原 List 很大（比如百万级），这种写法会额外分配一次内存；可考虑用 Stream + Collectors.toCollection(LinkedHashSet::new) 避免中间 List
TreeSet 虽然也能去重，但会按自然序或自定义序排序，不保证原始顺序

Stream API 去重时 `distinct()` 的限制在哪？

distinct() 内部依赖元素的 equals()/hashCode()，和 HashSet 行为一致——所以同样要求对象正确实现这两个方法。它不支持按指定字段去重（比如只看 id 字段）。

想按单个字段去重？得自己写 filter() + 状态容器，例如：

Set<Long> seenIds = ConcurrentHashMap.newKeySet();
list.stream()
    .filter(item -> seenIds.add(item.getId()))
    .collect(Collectors.toList());

用 Collectors.toMap() 可实现更灵活的去重逻辑（如保留最新/最早元素），但要注意键冲突时的合并函数
distinct() 是有状态操作，不能并行流里随意用——虽然它内部做了线程安全处理，但并行下顺序不保证，且性能未必优于单线程

数据库查出来的 List 去重，该在 Java 层还是 SQL 层做？

优先在 SQL 层用 DISTINCT 或 GROUP BY。Java 层去重是兜底手段，不是首选。

小微助手

微信推出的一款专注于提升桌面效率的助手型AI工具

下载

立即学习“Java免费学习笔记（深入）”；

SQL 去重能减少网络传输量、降低 JVM 堆压力，尤其当结果集含大量重复且字段多时
如果去重要求复杂（比如“相同 name 下取 created_time 最大的那条”），SQL 用 ROW_NUMBER() OVER (PARTITION BY ... ORDER BY ...) 更可靠
Java 层去重容易掩盖数据一致性问题：比如同名用户本应有唯一 ID，但 DB 里因 bug 出现了两条，Java 层一去重反而让问题更难被发现

真正需要 Java 层去重的场景，往往是多个异构数据源合并后统一清洗，或者业务规则无法用 SQL 表达（比如基于外部服务返回值判断是否重复）。

Java开发如何配置并发模型环境_Akka Actor依赖引入与测试

Java中高效提取字符串列表中的纯数字并转换为整数列表的完整指南

Java中方法的递归调用深度限制是多少_Java栈内存溢出解析

什么是Java中的多态性_方法动态绑定机制(Dynamic Binding)

Java中的Vector与ArrayList的区别_线程安全集合的同步机制与性能开销

相关标签:

java ai stream sql jvm Filter 堆线程对象数据库 bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：在Java里对象的内存布局是怎样的_Java对象结构解析下一篇：在Java里如何处理不同系统的环境差异_Java跨平台环境解析

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12