如何在 Pandas 中对滚动窗口应用自定义函数并灵活返回任意列数的结果

心靈之曲

发布时间：2026-01-30 18:54:09

424人浏览过

来源于php中文网

原创

如何在 Pandas 中对滚动窗口应用自定义函数并灵活返回任意列数的结果

本文介绍一种高效、无显式 for/while 循环的替代方案，利用 `numpy.sliding_window_view` 构建结构化滚动窗口，支持按列名操作 dataframe 子视图，并自由返回任意数量和名称的新列。

Pandas 原生的 DataFrame.rolling().apply() 在处理多列输入 → 多列输出（尤其是输出列数 ≠ 输入列数）且需按列名访问数据的场景时存在明显限制：raw=True 仅传入 NumPy 数组（丢失列名），而 raw=False 又强制要求返回值形状与输入一致（如 window.shape == (2, 3) 时必须返回 (2, 3)）。这使得实现如“基于 A/B/C 列计算 D/E/F/G 四个新指标”的需求变得困难。

此时，推荐使用 NumPy 1.20+ 提供的 sliding_window_view —— 它能以零拷贝方式生成滑动窗口视图，再结合轻量级 pd.DataFrame 构造（设置 copy=False），即可在保持高性能的同时获得完整 DataFrame 接口：

from numpy.lib.stride_tricks import sliding_window_view
import pandas as pd
import numpy as np

# 示例数据
df = pd.DataFrame({
    "A": range(10),
    "B": range(10, 20),
    "C": range(20, 30)
})
cols = ["A", "B", "C"]
window_size = 2

# 预分配结果列表（首行为 NaN 占位，对应窗口未就绪行）
results = [tuple([np.nan] * 4)]  # 对应 D, E, F, G 四列

# 滑动窗口遍历（shape: (n_windows, window_size, n_cols)）
for window_arr in sliding_window_view(df.values, window_shape=(window_size, len(cols))):
    # 构造临时 DataFrame（零拷贝，不复制原始数据）
    window_df = pd.DataFrame(window_arr[0], columns=cols, copy=False)

    # ✅ 自由按列名操作：可调用 .sum(), .mean(), .prod() 等，支持复杂逻辑
    D_val = window_df["A"].sum()                    # 标量
    E_val = (window_df["A"] + window_df["B"]).mean() # 标量
    F_val = (window_df["C"] - 1).prod()             # 标量
    G_val = (window_df["B"] * 2).sum()              # 标量

    results.append((D_val, E_val, F_val, G_val))

# 合并结果到原 DataFrame
result_df = pd.DataFrame(results, columns=["D", "E", "F", "G"])
df_final = pd.concat([df, result_df], axis=1)

print(df_final)

✅ 关键优势说明：

AI改图神器

AI万能图片编辑器，一键抠图，去水印，智能图片美化，照片转漫画，照片变活转视频，图片无损放大，一键背景虚化，位图智能转矢量图

下载

列名友好：window_df["A"] 直接访问，无需索引或位置硬编码；
输出自由：返回任意长度元组，映射为新列，不受输入列数约束；
性能可控：sliding_window_view 是内存视图（非复制），copy=False 进一步避免冗余拷贝；
可扩展性强：可在 window_df 上调用任意 Pandas 方法（groupby, agg, 自定义函数等）。

⚠️ 注意事项：

sliding_window_view 返回的是 ndarray 视图，确保原始 df.values 不被修改，否则影响结果；
若需跨行聚合（如窗口内每列独立统计），注意 window_arr[0] 提取的是第一个窗口切片（二维子数组），其行为与 df.iloc[i:i+window_size] 一致；
对于超大规模数据（>千万行），可考虑分块处理或改用 numba.jit 加速核心计算逻辑。

该方法在代码清晰度、灵活性与执行效率之间取得了良好平衡，是替代低效循环或受限 rolling.apply 的生产级实践方案。

Python如何提取图片文字_Tesseract OCR引擎自动化图文高精度识别转化文本

如何将 Python 脚本打包为独立可执行文件（.exe）并构建用户友好的界面

Python怎么重命名文件_os.rename与批量规范修改文件名脚本

如何将 Python 脚本打包为独立可执行文件（.exe）

Python怎么升级版本_无缝升级Python最新稳定版实操教程

相关标签:

windows 编码 win numpy pandas for while 循环接口切片 copy

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python tuple 不可变性的设计价值下一篇：Pandas 滚动窗口自定义函数应用：支持列名访问与灵活输出维度的高效实现

作者最新文章

Maven 多模块项目中按 Profile 动态构建子集模块的正确实践

2026-03-15 15:56

河马剧场短剧在线浏览入口在哪

2026-03-15 16:00

Java 控制台输出日文颜文字（Kaomoji）乱码问题的完整解决方案

2026-03-15 16:00

TypeScript ESM 导入中省略文件扩展名的正确配置方案

2026-03-15 16:02

如何在 Go 中正确处理 HTTP 超时错误并准确获取响应状态码

2026-03-15 16:52

如何在 Java 中正确编写空值检查以避免 @Nonnull 赋值警告

2026-03-15 16:58

Python 中安全高效地解析并验证字典键值对的自定义条件表达式

2026-03-15 17:01

实现 Circle 类的 add 方法：基于面积叠加计算新半径

2026-03-15 17:01

如何让包含多个的长 div 自动换行

2026-03-15 17:06

如何在 Go 中正确反序列化 JSON 并访问结构体字段

2026-03-15 17:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

while的用法

while的用法是“while 条件: 代码块”，条件是一个表达式，当条件为真时，执行代码块，然后再次判断条件是否为真，如果为真则继续执行代码块，直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容，供大家免费下载体验。

107

2023.09.25

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

2008

2023.10.19