在Java中如何使用distinct去除集合中的重复元素_Java去重操作解析

P粉602998670

发布时间：2026-02-04 09:48:08

489人浏览过

来源于php中文网

原创

distinct()严格依赖equals()和hashCode()的正确实现；自定义类必须重写二者，否则字段相同也被视为不同；按字段去重需filter+ConcurrentHashMap；去重逻辑须匹配业务语义。

在java中如何使用distinct去除集合中的重复元素_java去重操作解析

Java 8 Stream.distinct() 的适用前提和限制

distinct() 方法本身不依赖元素的业务逻辑，但它**严格依赖 equals() 和 hashCode() 的正确实现**。如果自定义对象没重写这两个方法，哪怕两个对象字段完全相同，distinct() 也会把它们视为不同元素。

常见错误现象：Stream.of(new User("Alice", 25), new User("Alice", 25)).distinct().count() 返回 2 —— 因为默认使用 Object 的 hashCode()，地址不同即不同。

对 String、Integer 等 JDK 内置类型可直接用 distinct()
对自定义类，必须确保 equals()/hashCode() 覆盖了所有参与“相等判断”的字段
注意：distinct() 是有状态操作，不能并行流中随意替换为无状态替代方案

按对象某个字段去重（比如 name 去重保留第一个）

标准 distinct() 不支持“按字段去重”，它只认整个对象是否重复。要实现“按 name 去重”，本质是需要一个“已见 name 集合”做状态记录。

推荐写法（线程安全、语义清晰）：

Geeksend

集成式自动化邮件营销管理平台

下载

立即学习“Java免费学习笔记（深入）”；

Set seen = ConcurrentHashMap.newKeySet();
list.stream()
    .filter(user -> seen.add(user.getName()))
    .collect(Collectors.toList());

用 ConcurrentHashMap.newKeySet() 而非 HashSet，避免并行流下 add() 竞态
seen.add(x) 返回 true 表示首次加入，正好作为 filter 条件
不建议用 Collectors.toMap() + Function.identity()，容易因重复 key 抛 IllegalStateException

distinct() 在 List、Set、Map 转换中的性能差异

distinct() 本身内部用的是 LinkedHashSet 缓存已见元素，所以时间复杂度是 O(n)，但会额外占用 O(n) 空间。实际效果受上游数据结构影响很大：

从 ArrayList 流式去重：典型场景，无额外开销
从已有 HashSet 开始流：此时再调 distinct() 完全冗余，纯属浪费 CPU 和内存
从数据库查出的 List>：每个 Map 默认无合理 equals()，distinct() 几乎无效，应先转成确定类型的对象再处理

替代方案：用 TreeSet 自定义去重逻辑（适合排序+去重）

如果既要按某字段去重，又希望结果有序（比如按 id 升序），TreeSet 比 “filter + Set 记录” 更简洁：

Set unique = list.stream()
    .collect(Collectors.toCollection(
        () -> new TreeSet<>(Comparator.comparing(User::getName))
    ));

注意：这会丢弃原始顺序；若需保持首次出现顺序，不能用此法
TreeSet 构造时传入的 Comparator 决定“重复”的含义 —— 两个元素比较结果为 0 即视为重复
该方式在元素量大且已知需排序时，比先 distinct() 再 sorted() 略高效（一次遍历完成两件事）

真正容易被忽略的是：**去重逻辑必须和业务语义对齐**。比如“手机号重复算重复”和“用户名重复算重复”是两种完全不同的判定，不存在通用的“智能去重”。写代码前先明确“什么才算重复”，再选 distinct()、filter+Set 还是 toMap，比堆砌技巧重要得多。

在Java中如何定位和排查线程死锁_Java并发问题分析方法解析

在Java中ThreadPoolExecutor如何工作_Java线程池原理解析

在Java里环境搭建完成后如何验证流程_Java完整测试说明

在Java中什么是Java内存模型_Java并发基础概念解析

在Java中如何实现控制台项目整体架构_Java初级项目结构解析

相关标签:

java stream String Integer Object count Filter 数据结构堆线程 map function 对象数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何让 JLabel 中的超大图片在 JFrame 外拖动时仍完整显示下一篇：Java异常处理中的多层嵌套异常如何捕获

作者最新文章

css属性如何继承父元素样式_通过理解继承规则简化代码

2026-02-04 10:23

如何在Golang中使用反射实现灵活的工厂模式_Golang工厂模式与反射实现

2026-02-04 10:23

css flexbox 布局为何比浮动更稳定_通过布局规则一致性解释

2026-02-04 10:24

在Java里如何定义main方法_Java程序入口语法说明

2026-02-04 10:25

css 自定义属性能配合选择器使用吗_属性与选择器结合说明

2026-02-04 10:25

mysql锁等待超时如何优化_mysql并发性能调整

2026-02-04 10:26

在Java中三元运算符怎么用_Java条件表达式解析

2026-02-04 10:26

css浮动元素后面出现空白怎么办_通过clear清除浮动

2026-02-04 10:27

在Java里原子性可见性有序性如何理解_Java并发特性说明

2026-02-04 10:27

在Java中如何遍历Set集合_Java集合遍历方式解析

2026-02-04 10:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

564

2023.08.02

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

198

2023.11.20

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

539

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06