
本文介绍一种基于“控制断点”(control break)逻辑的 php 数组分组方法:对多维数组按指定键(如 `grouped_by`)进行**顺序敏感分组**,即每当该键值发生变化时新建一个子数组,并为键名添加递增序号后缀(如 `1.1`、`1.2`),而非简单地合并所有相同键值项。
在实际业务场景中(如工时报告、日志聚合或时间序列数据归档),我们常需保留数据的原始顺序,并将连续出现的相同分组键值视为一个逻辑段(segment)。此时,传统 foreach + $result[$key][] = $item 的哈希式聚合方式无法满足需求——它会把所有 grouped_by => 1 的元素收进同一个键下,而忽略了它们在原数组中被 grouped_by => 4 中断的事实。
要实现题中所需的 [1.1] → [4.1] → [1.2] 这类带序号后缀的分段式分组,核心在于两点:
✅ 状态跟踪:记录上一个元素的 grouped_by 值,用于检测“断点”;
✅ 计数器管理:为每个 grouped_by 值维护一个独立的段计数器(如 grouped_by=1 出现第 2 段时,计数器为 2)。
以下是完整、健壮的实现代码:
function groupBySequentialSegments(array $items, string $key): array
{
$result = [];
$counters = [];
$previousValue = null;
foreach ($items as $item) {
$currentValue = $item[$key] ?? null;
// 检测“控制断点”:当前键值与前一项不同 → 新建段
if ($currentValue !== $previousValue) {
$counters[$currentValue] = ($counters[$currentValue] ?? 0) + 1;
}
// 构建唯一段键名:"{value}.{segment_number}"
$segmentKey = $currentValue . '.' . $counters[$currentValue];
$result[$segmentKey][] = $item;
$previousValue = $currentValue;
}
return $result;
}
// 使用示例
$report_items = [
['id' => 972, 'user_id' => 2, 'user_field_48' => 1, 'project' => '100 — NLO', 'duration' => '1:00', 'grouped_by' => 1],
['id' => 644, 'user_id' => 2, 'user_field_48' => 4, 'project' => '123 — QHV', 'duration' => '15:00', 'grouped_by' => 4],
['id' => 631, 'user_id' => 2, 'user_field_48' => 4, 'project' => '', 'duration' => '-5:00', 'grouped_by' => 4],
['id' => 630, 'user_id' => 2, 'user_field_48' => 1, 'project' => '', 'duration' => '22:00', 'grouped_by' => 1],
['id' => 971, 'user_id' => 2, 'user_field_48' => 1, 'project' => '100 — NLO', 'duration' => '1:00', 'grouped_by' => 1],
['id' => 973, 'user_id' => 2, 'user_field_48' => 1, 'project' => '100 — NLO', 'duration' => '1:00', 'grouped_by' => 1],
['id' => 974, 'user_id' => 2, 'user_field_48' => 1, 'project' => '100 — NLO', 'duration' => '1:00', 'grouped_by' => 1],
];
$segmented = groupBySequentialSegments($report_items, 'grouped_by');
print_r($segmented);输出效果(关键结构):
Array
(
[1.1] => Array( [0] => [...] ) // 第1段:grouped_by=1(首段)
[4.1] => Array( [0] => [...], [1] => [...] ) // 第1段:grouped_by=4(中断后新段)
[1.2] => Array( [0] => [...], [1] => [...], [2] => [...], [3] => [...] ) // 第2段:grouped_by=1(再次出现,序号+1)
)⚠️ 注意事项与最佳实践:
- 空值/缺失键安全:函数中使用 $item[$key] ?? null 防止未定义索引警告,生产环境建议提前校验数据完整性;
- 键名类型兼容性:$currentValue 可为整数、字符串甚至布尔值,但应避免 null 或 false 作为有效分组值(否则 0.1 与 false.1 可能混淆),必要时可增加类型标准化处理;
- 性能考量:该算法为单次遍历 O(n),无嵌套循环,适用于万级以内数据;超大数据集可结合生成器(Generator)流式处理;
- 扩展性提示:若需支持多级分组(如先按 grouped_by 再按 user_id),可将 $key 改为回调函数,动态提取复合键。
这种“顺序感知分组”是报表系统、导出模块和前端分页渲染中的典型需求。掌握其底层逻辑(状态机 + 计数器),不仅能解决当前问题,更能迁移到类似的时间窗口切分、状态变更日志聚合等场景。










