
引言:数据重构的需求
在PHP开发中,我们经常会遇到需要处理从数据库查询或其他数据源获取的扁平化数组数据。这些数据通常是一系列关联数组的列表,每个关联数组代表一个独立的记录。然而,在某些场景下,为了更好地组织和管理数据,或者为了满足特定的业务逻辑和前端展示需求,我们需要将这些扁平数据重构为更具层次感的多维数组。一个常见的需求是根据某个共同的属性(如 object_type)将所有相关的记录分组到一起。
考虑以下原始数据结构,这是一个包含多个记录的数组,其中 object_type 字段可能重复:
$originalArray = [
[
'initiator_id' => 259,
'object_type' => 1,
'object_id' => 905,
'date' => '2021-11-16 06:24:16',
],
[
'initiator_id' => 259,
'object_type' => 1,
'object_id' => 905,
'date' => '2021-11-16 04:54:54',
],
[
'initiator_id' => 259,
'object_type' => 1,
'object_id' => 905,
'date' => '2021-11-16 04:53:58',
],
[
'initiator_id' => 219,
'object_type' => 2,
'object_id' => 915,
'date' => '2021-11-16 04:53:58',
],
[
'initiator_id' => 220,
'object_type' => 3,
'object_id' => 916,
'date' => '2021-11-16 04:53:58',
],
[
'initiator_id' => 221,
'object_type' => 2,
'object_id' => 917,
'date' => '2021-11-16 04:53:58',
],
];我们的目标是将这个数组转换为一个多维数组,其中 object_type 的值将作为新的顶级键,每个顶级键下包含一个数组,该数组中存储所有 object_type 相同的原始记录。
目标数据结构
经过重构后,我们期望得到的数据结构如下所示:
立即学习“PHP免费学习笔记(深入)”;
[
1 => [ // object_type = 1 的所有记录
[ ... 原始记录0 ... ],
[ ... 原始记录1 ... ],
[ ... 原始记录2 ... ],
],
2 => [ // object_type = 2 的所有记录
[ ... 原始记录3 ... ],
[ ... 原始记录5 ... ],
],
3 => [ // object_type = 3 的所有记录
[ ... 原始记录4 ... ],
],
]实现方法:遍历与分组
实现这种数据重构最直接且常用的方法是遍历原始数组,并根据指定键的值动态地构建新的多维数组。
示例代码
259,
'object_type' => 1,
'object_id' => 905,
'date' => '2021-11-16 06:24:16',
],
[
'initiator_id' => 259,
'object_type' => 1,
'object_id' => 905,
'date' => '2021-11-16 04:54:54',
],
[
'initiator_id' => 259,
'object_type' => 1,
'object_id' => 905,
'date' => '2021-11-16 04:53:58',
],
[
'initiator_id' => 219,
'object_type' => 2,
'object_id' => 915,
'date' => '2021-11-16 04:53:58',
],
[
'initiator_id' => 220,
'object_type' => 3,
'object_id' => 916,
'date' => '2021-11-16 04:53:58',
],
[
'initiator_id' => 221,
'object_type' => 2,
'object_id' => 917,
'date' => '2021-11-16 04:53:58',
],
];
$groupedArray = []; // 初始化一个空数组用于存放重构后的数据
foreach ($originalArray as $item) {
// 检查当前元素是否包含 'object_type' 键
if (isset($item['object_type'])) {
$objectType = $item['object_type'];
// 如果 $groupedArray 中还没有以当前 objectType 为键的数组,则先创建一个
if (!isset($groupedArray[$objectType])) {
$groupedArray[$objectType] = [];
}
// 将当前元素添加到对应 objectType 的数组中
$groupedArray[$objectType][] = $item;
}
}
echo "";
print_r($groupedArray);
echo "
";
?>代码解析
-
$groupedArray = [];: 我们首先创建一个空的 $groupedArray,这将是最终存储重构后数据的容器。
-
foreach ($originalArray as $item): 遍历原始的扁平数组 $originalArray,每次循环 $item 变量将持有当前的一个关联数组(即一条记录)。
-
if (isset($item['object_type'])): 这是一个健壮性检查,确保当前 $item 确实包含我们用于分组的 object_type 键。在实际应用中,如果可以保证该键总是存在,这行可以省略。
-
$objectType = $item['object_type'];: 提取当前记录的 object_type 值,这个值将作为新多维数组的顶级键。
-
if (!isset($groupedArray[$objectType])) { $groupedArray[$objectType] = []; }: 这是分组逻辑的关键。在向 $groupedArray 添加数据之前,我们检查是否已经存在以当前 $objectType 为键的子数组。如果不存在,就创建一个新的空数组,以便后续将记录添加到其中。
-
$groupedArray[$objectType][] = $item;: 将当前的 $item(即原始记录)追加到 $groupedArray 中对应 $objectType 键的子数组中。[] 语法表示将元素作为新项添加到数组的末尾。
运行结果
执行上述代码,将得到以下输出:
Array
(
[1] => Array
(
[0] => Array
(
[initiator_id] => 259
[object_type] => 1
[object_id] => 905
[date] => 2021-11-16 06:24:16
)
[1] => Array
(
[initiator_id] => 259
[object_type] => 1
[object_id] => 905
[date] => 2021-11-16 04:54:54
)
[2] => Array
(
[initiator_id] => 259
[object_type] => 1
[object_id] => 905
[date] => 2021-11-16 04:53:58
)
)
[2] => Array
(
[0] => Array
(
[initiator_id] => 219
[object_type] => 2
[object_id] => 915
[date] => 2021-11-16 04:53:58
)
[1] => Array
(
[initiator_id] => 221
[object_type] => 2
[object_id] => 917
[date] => '2021-11-16 04:53:58
)
)
[3] => Array
(
[0] => Array
(
[initiator_id] => 220
[object_type] => 3
[object_id] => 916
[date] => 2021-11-16 04:53:58
)
)
)这个输出完美地实现了我们预期的按 object_type 分组的多维数组结构。
注意事项与最佳实践
键值类型: 用于分组的键 (object_type) 的值可以是字符串或整数。PHP 会自动处理这些作为数组键。
性能考量: 对于非常庞大的数组(例如数十万甚至上百万条记录),上述 foreach 循环的性能通常是可接受的。然而,如果遇到极端情况,可以考虑使用更底层的优化或数据库层面的分组(例如 SQL 的 GROUP BY 子句)来减少 PHP 脚本的内存和CPU开销。
健壮性: 在实际项目中,总是建议对用于分组的键进行 isset() 或 array_key_exists() 检查,以避免因数据不一致导致未定义索引错误。
-
通用性: 可以将上述逻辑封装成一个函数,使其更具通用性,接受原始数组和用于分组的键名作为参数:
function groupArrayByField(array $data, string $field): array { $grouped = []; foreach ($data as $item) { if (isset($item[$field])) { $value = $item[$field]; if (!isset($grouped[$value])) { $grouped[$value] = []; } $grouped[$value][] = $item; } } return $grouped; } $groupedData = groupArrayByField($originalArray, 'object_type'); // print_r($groupedData); -
array_reduce 方法: 对于更函数式编程风格的开发者,也可以使用 array_reduce 来实现同样的功能,但对于初学者来说,foreach 循环通常更易读和理解。
$groupedArrayReduce = array_reduce($originalArray, function ($carry, $item) { if (isset($item['object_type'])) { $objectType = $item['object_type']; $carry[$objectType][] = $item; } return $carry; }, []); // print_r($groupedArrayReduce);请注意,在使用 array_reduce 时,如果 $carry[$objectType] 不存在,PHP 会自动将其创建为数组。
总结
通过简单的 foreach 循环和条件判断,我们能够高效且灵活地将扁平化的关联数组列表重构为按指定键值分组的多维数组。这种数据重构技术在PHP开发中非常实用,能够帮助开发者更好地组织和管理复杂数据,为后续的数据处理和展示打下坚实的基础。掌握这一技巧,将使您在处理各种数据结构转换时游刃有余。











