0

0

Java Stream:基于聚合计数进行分组与排序的高效实践

碧海醫心

碧海醫心

发布时间:2025-11-17 18:48:01

|

806人浏览过

|

来源于php中文网

原创

Java Stream:基于聚合计数进行分组与排序的高效实践

本文详细介绍了如何利用java stream api,在仅允许一次流消费的前提下,对自定义对象流中的字符串属性进行分组、计数,并根据计数结果进行降序排序,对于计数相同的项再按字母顺序升序排序,最终生成一个有序的字符串列表。文章通过具体代码示例,演示了`collectors.groupingby`、`collectors.counting`以及自定义`comparator`的组合应用,提供了一种高效且符合函数式编程范式的解决方案。

Java Stream:基于聚合计数进行分组与排序

在处理数据流时,我们经常会遇到需要对数据进行分组、统计,并根据统计结果进行排序的场景。特别是在Java Stream API中,如果一个流只能被消费一次,这就要求我们设计一个单一的、连贯的操作链来完成所有任务。本教程将深入探讨如何高效地实现这一目标,即从一个自定义对象流中提取特定属性,根据其出现频率进行排序,并在频率相同的情况下进行二次排序。

1. 问题背景与挑战

假设我们有一个Stream,其中MyType是一个自定义类,包含一个String类型的category属性:

public class MyType {
    private String category;
    // 其他属性、构造函数、getter/setter等

    public MyType(String category) {
        this.category = category;
    }

    public String getCategory() {
        return category;
    }

    @Override
    public String toString() {
        return "MyType{category='" + category + "'}";
    }
}

我们的目标是生成一个List,包含所有唯一的category值,并按照以下规则进行排序:

  1. 主排序规则:根据每个category出现的次数(频率)进行降序排序。
  2. 次排序规则:如果两个category的出现次数相同,则按其字母顺序(字典序)进行升序排序。

核心挑战在于,我们只能对输入的Stream进行一次消费。

立即学习Java免费学习笔记(深入)”;

例如,给定以下输入:

{
    object1 :{category:"category1"},
    object2 :{category:"categoryB"},
    object3 :{category:"categoryA"},
    object4 :{category:"category1"},
    object5 :{category:"categoryB"},
    object6 :{category:"category1"},
    object7 :{category:"categoryA"}
}

期望的输出是:

List = {category1, categoryA, categoryB}

(因为category1出现3次,categoryA出现2次,categoryB出现2次。category1频率最高,categoryA和categoryB频率相同,但categoryA在字母顺序上先于categoryB。)

2. 解决方案:Stream API的组合应用

解决这个问题的关键在于两个步骤:

奇布塔
奇布塔

基于AI生成技术的一站式有声绘本创作平台

下载
  1. 分组与计数:首先,我们需要遍历流,将所有MyType对象按其category属性进行分组,并计算每个category出现的总次数。这将生成一个Map,其中键是category名称,值是其出现频率。
  2. 流化、排序与提取:接下来,我们将这个Map的entrySet()转换为一个新的流。然后,对这个流中的Map.Entry对象进行自定义排序,最后提取出排序后的category名称并收集到一个列表中。

2.1 详细实现

以下是实现上述逻辑的Java方法:

import java.util.Arrays;
import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;
import java.util.stream.Stream;

public class CategorySorter {

    // MyType 类定义(如上所示)
    public static class MyType {
        private String category;

        public MyType(String category) {
            this.category = category;
        }

        public String getCategory() {
            return category;
        }

        @Override
        public String toString() {
            return "MyType{category='" + category + "'}";
        }
    }

    /**
     * 根据类别出现频率(降序)和类别名称(升序)对类别进行排序。
     *
     * @param stream 包含MyType对象的流,只能消费一次。
     * @return 排序后的类别名称列表。
     */
    public static List getSortedCategories(Stream stream) {
        return stream
            // 步骤1: 分组并计数
            .collect(Collectors.groupingBy(
                MyType::getCategory, // 按MyType对象的category属性分组
                Collectors.counting() // 计算每个分组中的元素数量
            )) // 结果是一个 Map,例如: {"category1": 3, "categoryB": 2, "categoryA": 2}

            // 步骤2: 将Map的entrySet转换为流
            .entrySet().stream()

            // 步骤3: 对Map.Entry进行排序
            .sorted(
                // 主排序: 按值(计数)降序
                Map.Entry.comparingByValue().reversed()
                // 次排序: 如果值(计数)相同,则按键(类别名称)升序
                .thenComparing(Map.Entry.comparingByKey())
            )

            // 步骤4: 提取排序后的键(类别名称)
            .map(Map.Entry::getKey)

            // 步骤5: 收集结果到列表中 (Java 16+ 的简洁写法,Java 8-15 可用 .collect(Collectors.toList()))
            .toList(); 
    }

    public static void main(String[] args) {
        // 示例输入数据
        Stream inputData = Arrays.asList(
            new MyType("category1"),
            new MyType("categoryB"),
            new MyType("categoryA"),
            new MyType("category1"),
            new MyType("categoryB"),
            new MyType("category1"),
            new MyType("categoryA")
        ).stream();

        // 调用方法获取排序后的类别列表
        List sortedCategories = getSortedCategories(inputData);

        // 打印结果
        System.out.println("排序后的类别列表: " + sortedCategories); 
        // 预期输出: 排序后的类别列表: [category1, categoryA, categoryB]
    }
}

2.2 代码解析

  1. stream.collect(Collectors.groupingBy(MyType::getCategory, Collectors.counting())):

    • 这是整个解决方案的第一步,也是最关键的一步。它将原始的Stream转换为一个Map
    • Collectors.groupingBy(MyType::getCategory):这是一个下行收集器,它根据MyType对象的getCategory()方法返回的字符串对元素进行分组。
    • Collectors.counting():这是groupingBy的第二个参数,作为下游收集器。它会计算每个分组中的元素数量,并将结果作为Map的值。
    • 通过这一步,我们得到了每个类别的频率统计,并且只对原始流进行了一次消费。
  2. .entrySet().stream():

    • collect操作返回的是一个Map。为了对Map中的键值对进行排序,我们需要获取其entrySet(),并将其转换为一个新的Stream>。
  3. .sorted(Map.Entry.comparingByValue().reversed().thenComparing(Map.Entry.comparingByKey())):

    • 这是排序逻辑的核心。我们使用Map.Entry提供的静态方法来构建一个复合Comparator。
    • Map.Entry.comparingByValue():创建一个Comparator,根据Map.Entry的值(即类别计数Long)进行升序比较。
    • .reversed():紧接着comparingByValue()之后调用,将默认的升序比较反转为降序。这满足了我们“按频率降序”的主排序规则。
    • .thenComparing(Map.Entry.comparingByKey()):如果前一个比较器(即按值降序)认为两个元素相等(即它们的计数相同),则使用这个次级比较器。它根据Map.Entry的键(即类别名称String)进行升序比较。这满足了我们“频率相同则按字母顺序升序”的次排序规则。
  4. .map(Map.Entry::getKey):

    • 在排序完成后,我们不再需要Map.Entry的计数信息,只需要类别名称。map操作将每个Map.Entry对象转换为其对应的键(category字符串)。
  5. .toList():

    • 这是Java 16引入的一个便捷方法,用于将流中的所有元素收集到一个不可修改的List中。
    • 如果使用Java 8到Java 15,则应使用collect(Collectors.toList())。

3. 注意事项与总结

  • 单次流消费:本解决方案严格遵循了“流只能消费一次”的限制,通过一次collect操作将流转换为一个中间数据结构(Map),后续操作都是基于这个Map进行的。
  • 可读性与效率:使用Stream API的链式操作使得代码意图清晰,可读性强。groupingBy和counting是高度优化的收集器,能够高效地完成分组计数任务。
  • Java版本兼容性:核心逻辑在Java 8及更高版本中均可使用。toList()方法是Java 16的特性,如果使用旧版本,请替换为collect(Collectors.toList())。
  • 通用性:这种模式不仅适用于String类型的category,也可以扩展到其他可比较的类型,只需调整groupingBy的分类器和comparingByKey的类型即可。

通过以上方法,我们能够优雅且高效地解决在Java Stream中,对数据进行复杂分组、计数和多级排序的问题,即使在面对单次流消费的约束时也能游刃有余。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

443

2023.08.02

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1500

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

623

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

613

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

588

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

170

2025.07.29

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

1

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.9万人学习

C# 教程
C# 教程

共94课时 | 7.8万人学习

Java 教程
Java 教程

共578课时 | 52.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号