0

0

Pandas 中如何将上层分组 ID 向下填充至对应子行

碧海醫心

碧海醫心

发布时间:2026-01-04 14:42:09

|

596人浏览过

|

来源于php中文网

原创

Pandas 中如何将上层分组 ID 向下填充至对应子行

本文介绍在有序 dataframe 中,如何基于 level 列的层级关系(level 5 为分组头,level 8 为子项),将每个 level 5 对应的 id 向下广播填充至其后的所有 level 8 行,直至下一个 level 5 出现。

在处理具有嵌套结构的扁平化数据时(例如:分组标题 + 子记录),常需将“上级标识”(如 Level 5 的 ID)映射到其下属的所有“下级记录”(如后续连续的 Level 8 行)。Pandas 提供了简洁高效的向量化方案,无需循环或 groupby.apply,核心在于识别分组起点 + 前向填充(ffill)

✅ 推荐解法:直接匹配 Level == 5

最直观、稳健且易读的方式是:仅保留 Level 为 5 的行对应的 ID 值,其余位置设为 NaN,再使用 ffill() 向下填充:

df['Upper_ID'] = df['ID'].where(df['Level'] == 5).ffill()

该语句执行逻辑如下:

  • df['Level'] == 5 生成布尔 Series,标记所有 Level 5 行;
  • .where(...) 将非 Level 5 行的 ID 置为 NaN,只保留分组头的 ID;
  • .ffill() 沿索引方向(默认 axis=0)将上一个有效值向下传播,天然契合“每个 Level 5 定义新分组”的业务逻辑。

? 进阶理解:用 diff 捕捉层级下降点(可选)

若实际数据中“上层”不严格等于 5(例如可能是任意比下层小的值),可改用差分检测下降趋势:

Action Figure AI
Action Figure AI

借助Action Figure AI的先进技术,瞬间将照片转化为定制动作人偶。

下载
df['Upper_ID'] = df['ID'].where(df['Level'].diff(-1) < 0).ffill()

这里 diff(-1) 计算当前行与下一行的差值;当 Level 从高变低(如 8 → 5),差值为负,即 diff(-1)

⚠️ 注意事项

  • 数据必须有序:该方案假设 Level 5 总出现在其对应 Level 8 之前,且分组连续。若存在乱序或中间夹杂其他 Level,需先按业务逻辑排序(如 df.sort_values(['Group_ID', 'Level'], ascending=[True, True]))。
  • 类型一致性:ffill() 要求列支持缺失值(如 object 或可空整型),若 ID 是纯数字且无缺失,建议显式转换为允许 NaN 的类型(如 pd.StringDtype() 或 Int64)以避免隐式转换警告。
  • 性能优势:相比 cumsum() + groupby 或自定义循环,where + ffill 是纯向量化操作,在百万级数据上仍保持毫秒级响应。

最终结果完全符合预期:每个 Level 5 的 ID 成为其后所有 Level 8 行的 Upper_ID,清晰表达层级归属关系,为后续分组聚合、透视分析或导出结构化报告奠定基础。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

52

2025.12.04

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

17

2026.01.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

61

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

87

2026.01.19

java输出数组相关教程
java输出数组相关教程

本专题整合了java输出数组相关教程,阅读专题下面的文章了解更多详细内容。

39

2026.01.19

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

10

2026.01.19

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

13

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

19

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

160

2026.01.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Java 教程
Java 教程

共578课时 | 48.2万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号