0

0

Pandas 滚动窗口自定义函数应用:支持列名访问与任意输出维度的高效方案

心靈之曲

心靈之曲

发布时间:2026-01-30 20:04:02

|

183人浏览过

|

来源于php中文网

原创

Pandas 滚动窗口自定义函数应用:支持列名访问与任意输出维度的高效方案

本文介绍如何在 pandas 中实现真正灵活的滚动窗口计算——无需显式循环、保留 dataframe 列名访问能力,并支持输出任意数量/名称的新列。核心方案结合 `numpy.sliding_window_view` 与轻量级临时 dataframe 构建,兼顾可读性、表达力与性能。

Pandas 原生的 .rolling().apply() 在处理复杂窗口逻辑时存在明显限制:启用 raw=True 后函数接收的是 numpy.ndarray,无法通过列名(如 window["A"])访问数据;而关闭 raw 时又强制要求返回值形状与输入列数一致,难以生成多于或少于原列数的新特征。

一个简洁、可靠且生产就绪的替代方案是使用 NumPy 的 sliding_window_view ——它能以零拷贝方式生成滑动窗口视图,再配合极轻量的 pd.DataFrame(..., copy=False) 构造临时子表。这样既保持了列名语义(df_tmp["A"].mean()),又完全解耦输入列数与输出结构。

以下为完整可运行示例:

import pandas as pd
import numpy as np
from numpy.lib.stride_tricks import sliding_window_view

# 构造示例数据
df = pd.DataFrame({
    "A": range(10),
    "B": range(10, 20),
    "C": range(20, 30)
})

# 定义窗口大小(行数 × 列数),此处为 2 行 × 全部 3 列
window_rows, window_cols = 2, df.shape[1]
cols = df.columns.tolist()

# 预分配结果列表,首行为 NaN 占位(因窗口大小为 2,第 0 行无前置窗口)
results = [tuple([np.nan] * 4)]  # 对应新列 D, E, F, G

# 遍历每个滑动窗口(形状为 (2, 3) 的二维数组)
for window_arr in sliding_window_view(df.values, window_shape=(window_rows, window_cols)):
    # 构建无拷贝临时 DataFrame,保留原始列名
    df_tmp = pd.DataFrame(window_arr[0], columns=cols, copy=False)  # window_arr[0] 取首窗口块(2×3)

    # ✅ 自由使用列名进行任意计算(支持向量化操作)
    D = df_tmp["A"].sum()                    # 标量:A 列窗口和
    E = (df_tmp["A"] + df_tmp["B"]).mean()   # 标量:A+B 的窗口均值
    F = (df_tmp["C"] - 1).prod()             # 标量:C-1 的窗口乘积
    G = (df_tmp["B"] * 2).sum()              # 标量:B×2 的窗口和

    results.append((D, E, F, G))

# 批量拼接新列
new_cols_df = pd.DataFrame(results, columns=["D", "E", "F", "G"])
df_result = pd.concat([df, new_cols_df], axis=1)

print(df_result)

关键优势说明

Cutout.Pro
Cutout.Pro

AI驱动的视觉设计平台

下载
  • 列名友好:df_tmp["A"] 直观可读,支持 .groupby, .agg, 自定义函数等全部 DataFrame 语法;
  • 输出自由:返回任意长度元组 → 自动映射为指定列名,不受原始列数约束;
  • 内存高效:sliding_window_view 返回视图(view),copy=False 确保临时 DataFrame 不复制底层数据;
  • 可扩展性强:可轻松嵌入 def compute_features(df_slice): ... 封装复杂逻辑,便于单元测试与复用。

⚠️ 注意事项

  • sliding_window_view 要求 NumPy ≥ 1.20;旧版本可用 np.lib.stride_tricks.as_strided 手动实现,但需谨慎处理内存边界;
  • 窗口对齐默认为右对齐(即窗口覆盖 [i-1, i] 得到第 i 行结果),若需左对齐或居中,可调整 results 初始化与索引偏移;
  • 对超大规模数据(千万行+),可考虑分块处理或转向 Dask/Polars,但本方案在百万级数据上通常优于纯 Python 循环 10–50 倍。

该方法在保持代码清晰性的同时,突破了 .rolling().apply() 的固有瓶颈,是构建时间序列特征工程、滚动统计指标或模型滑动预测 pipeline 的推荐实践。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

68

2025.12.04

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

9

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

11

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

3

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

17

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

19

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

3

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号