0

0

如何在 Pandas 中精准定位目标值前后稳定区间的列值并填充到新列

心靈之曲

心靈之曲

发布时间:2026-01-17 14:42:32

|

342人浏览过

|

来源于php中文网

原创

如何在 Pandas 中精准定位目标值前后稳定区间的列值并填充到新列

本文介绍一种基于布尔掩码、`shift()` 和前向/后向填充的高效方法,用于在分组数据中识别 `column_1` 达到指定阈值(如 5)时,其上升沿前首个非零起点与下降沿后首个归零点对应的 `column_2` 值,并分别写入 `before` 和 `after` 列。

在时间序列或过程数据处理中,常需提取“事件触发点”(如某列达到关键阈值)前后特定状态下的观测值。本例中,目标是:对每个 ID 组,当 column_1 首次升至 5(即 column_1 == 5 的行),找出该峰值之前最近一次从 0 → 非零 转变时刻对应的 column_2 值(记为 Before),以及之后最近一次从 非零 → 0 转变时刻对应的 column_2 值(记为 After)

核心逻辑在于精准捕捉状态跃迁点:

  • 上升沿检测:column_1 > 0 且前一行 column_1 == 0 → 使用 col1.gt(0) & col1.shift(fill_value=0).eq(0)
  • 下降沿检测:column_1 == 0 且前一行 column_1 > 0 → 使用 col1.eq(0) & col1.shift().gt(0)

借助 where() 将非跃迁点置为 NaN,再通过 ffill()(前向填充)使 Before 值“传播”至后续首个 column_1 == 5 行;同理用 backfill() 使 After 值“反向传播”至前一个 column_1 == 5 行。

以下是完整实现代码(支持多 ID 分组):

白瓜AI
白瓜AI

白瓜AI,一个免费图文AI创作工具,支持 AI 仿写,图文生成,敏感词检测,图片去水印等等。

下载
import pandas as pd
import numpy as np

# 初始化 Before/After 列为 0(保持整型,避免 dtype 混合)
df[["Before", "After"]] = 0

def assign_before_after(group):
    col1 = group["column_1"]
    col2 = group["column_2"]
    is_peak = col1 == 5

    # 上升沿:当前 >0 且上一行为 0(首行用 fill_value=0 处理)
    rise_mask = col1.gt(0) & col1.shift(fill_value=0).eq(0)
    # 下降沿:当前 ==0 且上一行为 >0
    fall_mask = col1.eq(0) & col1.shift().gt(0)

    # 提取跃迁点 column_2 值,其余为 NaN
    before_vals = col2.where(rise_mask)
    after_vals = col2.where(fall_mask)

    # 前向填充:使 Before 值覆盖到下一个 peak 行
    before_filled = before_vals.ffill()
    # 后向填充:使 After 值覆盖到上一个 peak 行
    after_filled = after_vals.bfill()

    # 仅在 peak 行赋值,其余保持 0
    group.loc[is_peak, "Before"] = before_filled[is_peak]
    group.loc[is_peak, "After"] = after_filled[is_peak]

    return group

# 按 ID 分组应用
df = df.groupby("ID", group_keys=False).apply(assign_before_after)

关键注意事项

  • shift(fill_value=0) 确保首行能被正确识别为上升起点(若首行为非零,则 rise_mask 为 False,符合题设“若以非零开始,取首行 column_2”的补充逻辑——但本解法默认首行为 0;如需严格支持首行非零场景,可额外添加 group.iloc[0] 判断分支);
  • ffill() / bfill() 作用于整个组内序列,天然适配多次峰谷场景;
  • 初始化为 0 而非 NaN,既满足题目“其余填 0”的要求,又避免类型转换开销;
  • 若存在多个 column_1 == 5 的行,每行都会独立匹配其最近的上升/下降沿,行为可预测。

最终输出严格对齐预期:Before 和 After 仅在 column_1 == 5 的行有有效值,其余为 0,且按 ID 独立计算,无跨组干扰。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

51

2025.12.04

C++类型转换方式
C++类型转换方式

本专题整合了C++类型转换相关内容,想了解更多相关内容,请阅读专题下面的文章。

296

2025.07.15

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

4

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

1

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

10

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

33

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

15

2026.01.15

windows查看wifi密码教程大全
windows查看wifi密码教程大全

本专题整合了windows查看wifi密码教程大全,阅读专题下面的文章了解更多详细内容。

42

2026.01.15

浏览器缓存清理方法汇总
浏览器缓存清理方法汇总

本专题整合了浏览器缓存清理教程汇总,阅读专题下面的文章了解更多详细内容。

7

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Java 教程
Java 教程

共578课时 | 46.5万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号