0

0

如何提取 DataFrame 中末尾连续同号段(含零过渡)的所有行

花韻仙語

花韻仙語

发布时间:2026-02-10 17:43:00

|

723人浏览过

|

来源于php中文网

原创

如何提取 DataFrame 中末尾连续同号段(含零过渡)的所有行

本文介绍一种高效方法,用于从 pandas dataframe 中精准提取“末尾最后一个符号变化点之后”的所有连续行——即从倒数第一个符号切换位置起,直至数据末尾,自动跳过中间零值干扰,适用于高频振荡时序数据的切片分析。

在处理金融信号、传感器读数或任何具有正负交替特性的时序数据时,常需聚焦于“最新一段稳定趋势”:例如,当序列末尾连续为正值(或负值),而其前一个非零值符号相反,则我们希望提取该段全部行(含中间的零值)。难点在于:零值不改变符号但会中断判断;符号切换可能发生在任意位置;必须严格定位“最后一次切换”之后的子序列

下面给出稳健、向量化、无需循环的解决方案:

✅ 核心思路

  1. 屏蔽零值:用 .mask(df['v'].eq(0)) 将 0 视为缺失,避免其干扰符号逻辑;
  2. 前向填充(ffill):使零值继承前一个有效符号,实现“零值过渡归组”;
  3. 检测符号切换:计算相邻两值乘积 ≤ 0(即异号或任一为零),生成布尔标志;
  4. 累计分组:用 .cumsum() 将每次切换视为新组起点,末尾同号段必属同一最大组号;
  5. 提取末组:grp.eq(grp.max()) 精准筛选出最后一段连续同号(含过渡零)区域。

? 完整示例代码

import pandas as pd
import numpy as np

# 构造可复现示例(含零值与符号切换)
np.random.seed(42)
df = pd.DataFrame({
    'v': [1, 2, 3, -4, 0, 1, 2, -1, 0, 0, 5, 6]
})
print("原始数据:")
print(df)

# 步骤执行
s = df['v'].mask(df['v'] == 0).ffill()        # 屏蔽零并前向填充符号
grp = (s * s.shift()).le(0).cumsum()         # 相邻乘积≤0 → 切换点,cumsum分组
result = df[grp == grp.max()].reset_index(drop=True)

print("\n末尾同号段(含零过渡):")
print(result)

输出结果:

Socratic Lab
Socratic Lab

AI驱动的在线知识社区和AI知识搜索平台

下载
原始数据:
    v
0   1
1   2
2   3
3  -4
4   0
5   1
6   2
7  -1
8   0
9   0
10  5
11  6

末尾同号段(含零过渡):
    v
0   5
1   6
? 注意:第8–9行的 0 被前向填充为 −1(来自索引7),但因索引10值为 5(正),−1 × 5

⚠️ 关键注意事项

  • 零值处理策略可调:若需将零视为独立状态(而非过渡),可改用 np.sign(df['v']) 并自定义零映射(如 sign=0),再基于 diff().ne(0) 检测变化;
  • 首行边界:s.shift() 使首行为 NaN,乘积为 NaN → .le(0) 返回 False,不影响分组逻辑;
  • 性能优势:全程使用 Pandas 向量化操作,即使百万行也能毫秒级完成,远优于 iterrows() 或 apply;
  • 扩展性:该模式可轻松适配多列联合符号判断(如 df[['v', 'w']].apply(np.sign, axis=1))。

✅ 总结

本文方法以“符号分组 + 末组提取”为核心,兼顾鲁棒性与效率,彻底解决“末尾最后一段同号区间提取”这一典型时序切片需求。它不依赖固定窗口、不遍历索引、天然兼容零值,并可通过微调 mask 和 sign 逻辑适配各类业务定义——是处理振荡型时间序列数据的必备技巧之一。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

73

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

3

2026.01.31

go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

47

2025.09.03

传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

478

2024.06.04

包子漫画网页版入口与全集阅读指南_正版免费漫画快速访问方法
包子漫画网页版入口与全集阅读指南_正版免费漫画快速访问方法

本专题汇总了包子漫画官网和网页版入口,提供最新章节抢先看方法、正版免费阅读指南,以及稳定访问方式,帮助用户快速直达包子漫画页面,无广告畅享全集漫画内容。

37

2026.02.10

MC.JS网页版快速畅玩指南_MC.JS官网在线入口及免安装体验方法
MC.JS网页版快速畅玩指南_MC.JS官网在线入口及免安装体验方法

本专题汇总了MC.JS官网入口和网页版快速畅玩方法,提供免安装访问、不同版本(1.8.8、1.12.8)在线体验指南,以及正版网页端操作说明,帮助玩家轻松进入MC.JS世界,实现即时畅玩与高效体验。

23

2026.02.10

谷歌邮箱网页版登录与注册全指南_Gmail账号快速访问与安全操作教程
谷歌邮箱网页版登录与注册全指南_Gmail账号快速访问与安全操作教程

本专题汇总了谷歌邮箱网页版的最新登录入口和注册方法,详细提供官方账号快速访问方式、网页版操作教程及安全登录技巧,帮助用户轻松管理Gmail邮箱账户,实现高效、安全的邮箱使用体验。

20

2026.02.10

铁路12306订票与退改全攻略_高效购票与座位选取技巧
铁路12306订票与退改全攻略_高效购票与座位选取技巧

本专题全面汇总铁路12306订票、退票、改签及候补订单操作技巧,提供车厢座位分布参考、抢票攻略和高铁安检注意事项,帮助新手用户快速掌握高效购票与退改流程,提高出行效率和体验。

14

2026.02.10

TensorFlow2深度学习模型实战与优化
TensorFlow2深度学习模型实战与优化

本专题面向 AI 与数据科学开发者,系统讲解 TensorFlow 2 框架下深度学习模型的构建、训练、调优与部署。内容包括神经网络基础、卷积神经网络、循环神经网络、优化算法及模型性能提升技巧。通过实战项目演示,帮助开发者掌握从模型设计到上线的完整流程。

0

2026.02.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号