0

0

Java中实现类似NumPy array_split 的列表分块操作

花韻仙語

花韻仙語

发布时间:2025-09-05 16:27:23

|

681人浏览过

|

来源于php中文网

原创

Java中实现类似NumPy array_split 的列表分块操作

本教程旨在介绍如何在Java中将一个列表(List)高效地分割成n个大致相等大小的子列表,以实现类似于Python NumPy库中array_split函数的功能。我们将重点探讨使用Google Guava库的Lists.partition方法,并详细说明如何计算分块大小以满足需求,提供实用的代码示例和注意事项。

引言:列表分块的需求与NumPy array_split

在数据处理和并行计算等场景中,我们经常需要将一个大型列表或数组分割成若干个较小的、大致相等大小的子列表或子数组。例如,当需要将任务分配给多个线程并行处理时,将原始数据集均匀分块是常见的做法。

在Python的NumPy库中,numpy.array_split(x, n) 提供了一个非常便捷的方法,可以将数组 x 分割成 n 个大致相等的子数组,即使 x 的长度不能被 n 整除,它也能智能地分配剩余元素。例如:

import numpy
x = [7, 3, 9, 10, 5, 6, 8, 13]
print(numpy.array_split(x, 3))
# 输出: [array([7, 3, 9]), array([10, 5, 6]), array([ 8, 13])]

然而,Java标准库中并没有直接提供一个与 numpy.array_split 功能完全对等的内置方法。虽然可以手动编写循环逻辑来实现,但更推荐使用成熟的第三方库来简化开发并确保代码的健壮性。本文将重点介绍如何利用Google Guava库来实现这一功能。

使用Google Guava Lists.partition 实现高效分块

Google Guava 是一个广泛使用的Java核心库,提供了许多实用的工具类和方法,其中包括 Lists.partition。Lists.partition(list, size) 方法可以将一个列表分割成固定大小为 size 的子列表。要实现类似于 numpy.array_split(list, n) 的功能(即分割成 n 份),我们需要巧妙地计算出每个子列表的 size。

核心原理:计算分块大小以实现指定份数分割

Lists.partition(list, size) 的 size 参数是每个子列表的最大长度。如果我们想将一个列表 originalList 分割成 n 个子列表,那么每个子列表的理想大小 size 应该为 originalList.size() / n。考虑到列表长度可能无法被 n 整除,我们需要向上取整,以确保所有元素都能被包含在 n 个子列表中。

立即学习Java免费学习笔记(深入)”;

计算公式如下: chunkSize = Math.ceil(originalList.size() / (double) n)

将 originalList.size() 转换为 double 类型进行除法运算,然后使用 Math.ceil() 向上取整,最后再转换为 int 类型,即可得到所需的 chunkSize。

代码示例

下面是一个完整的Java代码示例,演示了如何使用Guava的 Lists.partition 方法将一个列表分割成指定数量的子列表:

MCP.so
MCP.so

发现优秀的MCP服务器和客户端

下载

首先,确保你的项目中已引入Guava依赖。如果你使用Maven,可以在 pom.xml 中添加以下依赖:


    com.google.guava
    guava
    32.1.3-jre 

然后,你可以编写以下Java代码:

import com.google.common.collect.Lists;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

public class ListSplitter {

    public static void main(String[] args) {
        // 原始列表
        List originalList = new ArrayList<>(Arrays.asList(7, 3, 9, 10, 5, 6, 8, 13));
        System.out.println("原始列表: " + originalList);

        // 目标分块数量
        int numberOfPartitions = 3;
        System.out.println("目标分块数量: " + numberOfPartitions);

        // 计算每个子列表的大小
        // 使用 Math.ceil 确保向上取整,以包含所有元素
        int chunkSize = (int) Math.ceil(originalList.size() / (double) numberOfPartitions);
        System.out.println("计算出的每个子列表大小 (chunkSize): " + chunkSize);

        // 使用 Guava 的 Lists.partition 进行分块
        List> partitions = Lists.partition(originalList, chunkSize);

        // 打印分块结果
        System.out.println("分块结果:");
        for (int i = 0; i < partitions.size(); i++) {
            System.out.println("  子列表 " + (i + 1) + ": " + partitions.get(i));
        }

        // 示例:处理空列表
        List emptyList = new ArrayList<>();
        System.out.println("\n处理空列表:");
        List> emptyPartitions = Lists.partition(emptyList, 3); // chunkSize 至少为1
        System.out.println("  空列表分块结果: " + emptyPartitions);

        // 示例:当分块数量大于列表元素数量时
        List smallList = new ArrayList<>(Arrays.asList(1, 2));
        int smallListPartitions = 5;
        int smallListChunkSize = (int) Math.ceil(smallList.size() / (double) smallListPartitions); // 2/5 = 0.4 -> ceil(0.4) = 1
        System.out.println("\n处理小列表 (分块数 > 元素数): " + smallList);
        System.out.println("  目标分块数量: " + smallListPartitions + ", 计算出的 chunkSize: " + smallListChunkSize);
        List> resultSmallList = Lists.partition(smallList, smallListChunkSize);
        System.out.println("  分块结果: " + resultSmallList);
    }
}

运行结果示例:

原始列表: [7, 3, 9, 10, 5, 6, 8, 13]
目标分块数量: 3
计算出的每个子列表大小 (chunkSize): 3
分块结果:
  子列表 1: [7, 3, 9]
  子列表 2: [10, 5, 6]
  子列表 3: [8, 13]

处理空列表:
  空列表分块结果: []

处理小列表 (分块数 > 元素数): [1, 2]
  目标分块数量: 5, 计算出的 chunkSize: 1
  分块结果: [[1], [2]]

从结果可以看出,[7, 3, 9, 10, 5, 6, 8, 13] 被成功分割成了 [7, 3, 9]、[10, 5, 6] 和 [8, 13] 三个子列表,与NumPy array_split 的行为一致。

Lists.partition 的特性与注意事项

  1. 返回的是视图 (View): Lists.partition 返回的 List> 并不是包含独立新列表的列表。它返回的每个子列表都是原始列表的一个视图。这意味着对子列表的修改会直接反映到原始列表上,反之亦然。如果需要独立的子列表,你需要手动复制它们(例如,使用 new ArrayList(subList))。
  2. 效率: 由于返回的是视图,Lists.partition 在创建子列表时避免了不必要的数据复制,因此效率很高,尤其适用于处理大型列表。
  3. 边界条件:
    • 空列表: 如果原始列表为空,Lists.partition 将返回一个空列表的列表。
    • chunkSize 为零或负数: Lists.partition 会抛出 IllegalArgumentException。在我们的计算中,chunkSize 至少为1(除非 numberOfPartitions 极大导致 originalList.size() / (double) numberOfPartitions 接近0,但 Math.ceil 会处理),因此通常不会出现此问题。
    • numberOfPartitions 大于 originalList.size(): 我们的 chunkSize 计算 (Math.ceil(originalList.size() / (double) numberOfPartitions)) 仍能正确工作。例如,如果 originalList 有2个元素,要分成5份,chunkSize 会计算为 ceil(2/5.0) = 1。最终会得到 [[1], [2]] 两个子列表,而不是5个。这与 numpy.array_split 的行为略有不同,NumPy 会尝试创建 n 个数组,即使其中一些可能是空的。Guava 的方法会创建尽可能多的非空子列表,直到所有元素都被分配。

总结

在Java中实现类似于NumPy array_split 的列表分块功能,最简洁高效的方法是结合使用Google Guava库的 Lists.partition 方法和精确的 chunkSize 计算。通过 chunkSize = (int) Math.ceil(originalList.size() / (double) numberOfPartitions),我们可以确保列表被分割成大致相等数量的子列表,并覆盖所有原始元素。这种方法不仅代码简洁,而且由于 Lists.partition 返回视图的特性,也具有较高的执行效率。在实际项目中,引入Guava库能有效提升开发效率和代码质量。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Java Maven专题
Java Maven专题

本专题聚焦 Java 主流构建工具 Maven 的学习与应用,系统讲解项目结构、依赖管理、插件使用、生命周期与多模块项目配置。通过企业管理系统、Web 应用与微服务项目实战,帮助学员全面掌握 Maven 在 Java 项目构建与团队协作中的核心技能。

0

2025.09.15

guava包作用
guava包作用

guava是一个java库,增强了java标准库,提供更有效率和易于使用的集合、实用程序、缓存和并发工具。想了解更多guava的相关内容,可以阅读本专题下面的文章。

261

2024.05.29

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1897

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2091

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1056

2024.11.28

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

422

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

544

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

73

2025.08.29

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号