Pandas 滚动窗口自定义函数应用：支持列名访问与灵活输出维度的高效方案

霞舞

发布时间：2026-01-30 22:39:01

436人浏览过

来源于php中文网

原创

Pandas 滚动窗口自定义函数应用：支持列名访问与灵活输出维度的高效方案

本文介绍如何在 pandas 中实现真正灵活的滚动窗口计算——既能按列名（如 `df["a"]`）访问数据，又不受输入/输出列数必须一致的限制，避开 `rolling().apply(raw=true)` 的局限性。

Pandas 原生的 DataFrame.rolling().apply() 在处理复杂滚动逻辑时存在两个关键限制：一是启用 raw=True 时传入的是 numpy.ndarray，丢失列名和索引信息；二是要求返回值形状必须与原始 DataFrame 列数对齐（即 axis=1 下每行输出长度固定），无法自由生成任意数量的新列。

幸运的是，numpy.lib.stride_tricks.sliding_window_view 提供了一种更底层、更可控的替代方案。它能在不复制内存的前提下，将二维数组切分为连续的滑动窗口视图（view），再结合轻量级临时 DataFrame 构造（copy=False），即可在保持高性能的同时，完全保留列语义和输出自由度。

以下是一个完整、可复用的实现示例：

import pandas as pd
import numpy as np
from numpy.lib.stride_tricks import sliding_window_view

# 构造示例数据
df = pd.DataFrame({
    "A": range(10),
    "B": range(10, 20),
    "C": range(20, 30)
})

# 定义滚动窗口大小（行数 × 列数）
window_rows = 2
window_cols = df.shape[1]  # 覆盖全部列

# 使用 sliding_window_view 获取 (n_windows, window_rows, n_cols) 形状的视图
# 注意：仅沿行轴滑动，因此 window_shape = (window_rows, window_cols)
windows = sliding_window_view(df.values, window_shape=(window_rows, window_cols))

# 初始化结果列表（首行为 NaN 占位，对应窗口未就绪位置）
results = [tuple([np.nan] * 4)]  # 假设输出 4 列：D, E, F, G

# 遍历每个窗口（注意：sliding_window_view 返回的是 view，非 copy）
for window_2d in windows:
    # window_2d shape: (2, 3) → 构造临时 DataFrame（copy=False 避免内存开销）
    temp_df = pd.DataFrame(window_2d, columns=df.columns, copy=False)

    # ✅ 现在可自由使用列名进行计算！
    D_val = temp_df["A"].sum()                    # 如：A 列窗口和
    E_val = (temp_df["A"] + temp_df["B"]).mean()  # A+B 的均值
    F_val = (temp_df["C"] - 1).prod()             # C-1 的连乘
    G_val = (temp_df["B"] * 2).sum()              # B×2 的和

    results.append((D_val, E_val, F_val, G_val))

# 合并结果到原 DataFrame
result_df = pd.DataFrame(results, columns=["D", "E", "F", "G"])
df_final = pd.concat([df, result_df], axis=1)

print(df_final)

✅ 优势总结：

WisPaper

复旦大学研发的AI学术搜索工具，5分钟内筛选1000篇论文

下载

列名友好：每个窗口都封装为标准 pd.DataFrame，支持 .loc, ["col"], query() 等全部 Pandas 语法；
输出自由：返回任意长度元组或字典，轻松映射到新列，无需与输入列数对齐；
内存高效：sliding_window_view 是零拷贝视图，copy=False 进一步避免中间 DataFrame 冗余复制；
可扩展性强：可轻松嵌入自定义函数、条件分支、多步计算，甚至调用 scikit-learn 模型预测。

⚠️ 注意事项：

sliding_window_view 要求 NumPy ≥ 1.20；旧版本可降级使用 np.lib.stride_tricks.as_strided（需手动计算 strides，更易出错）；
窗口起始位置默认从第 0 行开始，长度为 len(df) - window_rows + 1，因此结果比原 DataFrame 少 window_rows - 1 行 —— 示例中通过首行填充 NaN 对齐，你也可根据业务选择 min_periods 或 center=True 等策略；
若需并行加速（如窗口计算极重），可结合 concurrent.futures.ThreadPoolExecutor 对 windows 进行批处理，但需注意 GIL 和 I/O 密集型场景的收益边界。

该方法虽含显式循环，但其内核是向量化 NumPy 视图操作，实际性能远超纯 Python 循环，且代码清晰、调试友好、维护成本低，是替代 rolling().apply() 复杂定制需求的工业级实践方案。

Python with语句怎么用_上下文管理器自动关闭文件指针

Python怎么降级版本_退回旧版本Python解释器实操指南

Python怎么查看数据统计摘要_Pandas的describe方法使用

Python Django后台怎么加功能_自定义Admin动作Actions实现批量修改及定制化导出按钮

Python如何配置国内源_pip永久更改清华与阿里云镜像源

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1564

2023.07.26

查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口，端口占用问题是计算机系统编程领域的一个常见问题，端口占用的根本原因可能是操作系统的一些错误，服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1173

2023.07.27

windows照片无法显示

当我们尝试打开一张图片时，可能会出现一个错误提示，提示说"Windows照片查看器无法显示此图片，因为计算机上的可用内存不足"，本专题为大家提供windows照片无法显示相关的文章，帮助大家解决该问题。

840

2023.08.01

windows查看端口被占用的情况

windows查看端口被占用的情况的方法：1、使用Windows自带的资源监视器；2、使用命令提示符查看端口信息；3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容，供大家免费下载体验。

464

2023.08.02

windows无法访问共享电脑

在现代社会中，共享电脑是办公室和家庭的重要组成部分。然而，有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享，影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

2364

2023.08.08

windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新，以提高系统的稳定性和安全性。然而，有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

875

2023.08.10

Go Web框架Gin接口开发与中间件设计实践

本专题围绕 Go 在 Web 后端开发中的主流框架 Gin 展开，系统讲解高性能接口开发与中间件机制设计。内容涵盖路由分组、请求绑定、参数校验、统一响应封装、日志与鉴权中间件实现，以及接口限流与异常处理策略。通过实战项目案例，帮助开发者构建结构清晰、性能优良的 Go Web 服务体系，提升接口开发效率与系统可维护性。

2026.03.19

热门下载

网站特效

网站源码

网站素材

前端模板