数组分块（Chunking）技术详解：按指定宽度拆分数组为子数组

霞舞

发布时间：2025-12-05 10:16:07

655人浏览过

来源于php中文网

原创

数组分块（chunking）技术详解：按指定宽度拆分数组为子数组

数组分块（Chunking）是一种将一个大型数组按照指定宽度拆分为多个小型子数组的常用操作。这种技术在数据处理、分页显示、批量操作等场景中非常实用，能够有效管理和处理数据集合。本文将深入探讨数组分块的概念、实现原理，并提供专业的代码示例，帮助读者理解并掌握这一高效的数据处理方法。

数组分块（Chunking）的定义与应用场景

数组分块，通常被称为“chunking”，是指将一个一维数组分割成多个二维子数组，每个子数组（或称“块”）包含固定数量的元素。最后一个子数组可能包含少于指定宽度的元素，如果原始数组的长度不能被宽度整除。

这种操作在实际开发中有着广泛的应用：

分页显示： 当从数据库获取大量数据时，可以将其分块以实现前端的分页显示，每次只渲染一页的数据。
批量处理： 在进行API请求或数据库操作时，为了避免单次处理数据量过大导致性能问题，可以将数据分块后进行批量提交。
数据并行化： 将数据分块后分配给不同的线程或进程进行并行计算，提高处理效率。

例如，给定数组 [1, 2, 3, 4, 5, 6, 7] 和宽度 3，期望的输出是 [[1, 2, 3], [4, 5, 6], [7]]。

实现数组分块的核心逻辑

实现数组分块的核心思想是遍历原始数组，并根据指定的宽度，从原始数组中“切片”出子数组，然后将这些子数组收集到一个新的数组中。

1. 基础迭代与切片方法

最直观的方法是使用循环和数组的切片（slice）功能。我们可以维护一个索引，每次增加指定宽度，然后从当前索引位置开始切片。

听脑AI

听脑AI语音，一款专注于音视频内容的工作学习助手，为用户提供便捷的音视频内容记录、整理与分析功能。

下载

/**
 * 将数组分块为指定宽度的子数组
 * @param {Array} array 原始数组
 * @param {number} size 每个子数组的宽度
 * @returns {Array<Array>} 分块后的数组
 */
function chunkArray(array, size = 1) {
    // 确保宽度有效，至少为1
    size = Math.max(Math.floor(size), 0);
    if (!array || array.length === 0 || size < 1) {
        return [];
    }

    const result = [];
    let index = 0;
    while (index < array.length) {
        // 从当前索引开始，切片出指定宽度的子数组
        result.push(array.slice(index, index + size));
        // 移动索引到下一个块的起始位置
        index += size;
    }
    return result;
}

示例代码：

const inputArray = [1, 2, 3, 4, 5, 6, 7];
const width = 3;
const chunkedArray = chunkArray(inputArray, width);
console.log(chunkedArray);
// 输出: [[1, 2, 3], [4, 5, 6], [7]]

const anotherArray = ['a', 'b', 'c', 'd', 'e'];
const anotherWidth = 2;
console.log(chunkArray(anotherArray, anotherWidth));
// 输出: [['a', 'b'], ['c', 'd'], ['e']]

console.log(chunkArray([], 3)); // 输出: []
console.log(chunkArray([1, 2, 3], 0)); // 输出: []
console.log(chunkArray([1, 2, 3], 1)); // 输出: [[1], [2], [3]]

2. 借鉴 Lodash 的优化实现

许多流行的 JavaScript 工具库，如 Lodash，都提供了高度优化且功能丰富的 chunk 函数。这些库的实现通常会考虑更多的边缘情况和性能优化。以下是 Lodash chunk 函数的核心逻辑简化版，它展示了如何预先计算结果数组的大小，并使用 Array 构造函数来优化内存分配。

/**
 * Lodash 风格的数组分块实现
 * @param {Array} array 原始数组
 * @param {number} size 每个子数组的宽度
 * @returns {Array<Array>} 分块后的数组
 */
function lodashChunk(array, size = 1) {
    // 确保宽度为正整数，且至少为1
    size = Math.max(Math.floor(size), 0);
    const length = array == null ? 0 : array.length;

    // 处理空数组、无效宽度等边缘情况
    if (!length || size < 1) {
        return [];
    }

    let index = 0;
    let resIndex = 0;
    // 预先计算结果数组的长度，并初始化数组
    // Math.ceil(length / size) 确保即使有余数也能分配足够的空间
    const result = new Array(Math.ceil(length / size));

    while (index < length) {
        // 使用 slice 获取子数组，并直接赋值到结果数组的相应位置
        result[resIndex++] = array.slice(index, (index += size));
    }
    return result;
}

这个实现与我们手动编写的 chunkArray 函数在核心逻辑上非常相似，但 Lodash 的版本在处理类型转换、空值检查和预分配内存方面更为严谨和优化。

注意事项与最佳实践

宽度验证： 始终确保 size 参数是一个有效的正整数。如果 size 小于 1，应返回空数组，避免无限循环或不符合预期的结果。
空数组处理： 当输入数组为空时，函数应返回一个空数组，而不是抛出错误。
性能考量： 对于非常大的数组，库函数（如 Lodash 的 chunk）通常会比自己手动编写的简单循环更高效，因为它们经过了广泛的测试和优化。
可读性： 命名清晰的函数（如 chunkArray 或 splitIntoChunks）可以提高代码的可读性和维护性。
不可变性： 上述实现都遵循了不可变性原则，即它们不会修改原始数组，而是返回一个新的分块数组。这通常是函数式编程和数据处理中的最佳实践。

总结

数组分块（Chunking）是前端和后端开发中一个非常实用的数据处理技巧。通过将大型数组分割成更小的、易于管理的子数组，我们可以优化性能、简化逻辑并提高代码的可读性。无论是通过手动迭代和切片，还是利用像 Lodash 这样的成熟库，理解其核心原理和应用场景对于编写高效、健壮的代码都至关重要。掌握这一技术，将使你在处理复杂数据结构时更加得心应手。

JavaScript变量提升Hoisting现象的发生原理与规避

JavaScript 中调用自定义字符串方法时的常见错误与正确实现方式

使用 JavaScript 的 reduce 方法统计数组中各元素出现次数

JavaScript 文本“解密”动画失效的完整修复与重构指南

JavaScript 中调用自定义字符串方法时的常见错误及正确实现方式

相关专题

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

go语言数组和切片

本专题整合了go语言数组和切片的区别与含义，阅读专题下面的文章了解更多详细内容。

2025.09.03

C++类型转换方式

本专题整合了C++类型转换相关内容，想了解更多相关内容，请阅读专题下面的文章。

320

2025.07.15

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

389

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2112

2023.08.14