0

0

在Python中使用NumPy高效实现2D数组滑动窗口操作

碧海醫心

碧海醫心

发布时间:2025-10-15 11:49:18

|

1009人浏览过

|

来源于php中文网

原创

在python中使用numpy高效实现2d数组滑动窗口操作

本文详细介绍了如何在Python中利用NumPy库高效地对二维数组执行滑动窗口操作。我们将对比手动循环实现与NumPy内置的`sliding_window_view`函数,展示后者在性能和代码简洁性上的显著优势,并提供具体代码示例和使用注意事项,帮助读者掌握这一强大的数据处理技巧。

引言:滑动窗口操作及其重要性

滑动窗口(Sliding Window)是一种在数据处理中广泛应用的技术,尤其在图像处理、信号处理、时间序列分析和机器学习等领域。它通过在数据上“滑动”一个固定大小的窗口,对窗口内的数据进行局部操作(如求和、求平均、求中位数等),从而提取局部特征或进行局部转换。

在Python中处理大规模数组数据时,效率是关键。传统的基于循环的滑动窗口实现方式虽然直观,但往往伴随着性能瓶颈,尤其是在处理大型二维数组时。本教程将重点介绍NumPy库中numpy.lib.stride_tricks.sliding_window_view函数,它提供了一种高度优化的方法来创建滑动窗口的“视图”,避免了数据复制,从而极大地提高了处理效率。

传统手动循环实现滑动窗口的局限性

在深入探讨NumPy的优化方案之前,我们先来看一个典型的手动实现滑动窗口的例子。这种方法通常涉及嵌套循环和数组切片,以逐个提取每个窗口。

立即学习Python免费学习笔记(深入)”;

假设我们有一个二维数组median_x_array,需要提取所有3x3的滑动窗口,并将其展平后存储。为了处理边界情况,我们通常会先对数组进行填充(padding)。

import numpy as np

# 示例二维数组 (例如,一个5x5的随机数组)
median_x_array = np.random.rand(5, 5)
window_size = 3

# 用于存储展平后的滑动窗口
median_x_neighbors_manual = []

# 对数组进行填充,这里使用 'wrap' 模式,填充宽度为1 (对于3x3窗口)
# pad_width = (window_size - 1) // 2
padded_array_manual = np.pad(median_x_array, pad_width=1, mode='wrap')

print("原始数组:\n", median_x_array)
print("\n填充后的数组:\n", padded_array_manual)

# 通过嵌套循环手动实现滑动窗口
# 循环范围需要考虑窗口大小,确保不会超出填充数组的边界
for i in range(padded_array_manual.shape[0] - window_size + 1):
    for j in range(padded_array_manual.shape[1] - window_size + 1):
        # 提取当前窗口
        subarray = padded_array_manual[i:i+window_size, j:j+window_size]
        # 将窗口展平
        flattened_subarray = subarray.flatten()
        median_x_neighbors_manual.append(flattened_subarray)

print("\n手动实现的前3个滑动窗口(展平):\n", median_x_neighbors_manual[:3])
print("手动实现的滑动窗口总数:", len(median_x_neighbors_manual))

这种手动实现方式的问题在于:

AI导航网
AI导航网

AI工具导航网,发现AI新世界

下载
  1. 性能开销:每次迭代都会创建一个新的子数组视图,虽然NumPy的切片操作本身效率较高,但大量的循环和切片操作在大型数组上仍然会产生显著的性能开销。
  2. 代码冗余:需要编写多层嵌套循环来管理窗口的滑动逻辑,代码相对繁琐。
  3. 内存效率:虽然subarray是视图,但如果后续对flattened_subarray进行复制操作,则会产生额外的内存消耗。

使用 numpy.lib.stride_tricks.sliding_window_view 优化滑动窗口操作

NumPy的sliding_window_view函数提供了一种更高效、更简洁的方式来创建滑动窗口。它不复制数据,而是返回一个原始数组的“视图”,这个视图的形状被调整为包含所有可能的滑动窗口。这使得对窗口的后续操作能够直接在视图上进行,从而避免了大量的数据复制和循环开销。

函数介绍

numpy.lib.stride_tricks.sliding_window_view(x, window_shape, axis=None, subok=False, writeable=False)

  • x: 输入的NumPy数组。
  • window_shape: 一个表示窗口形状的元组。例如,对于一个3x3的窗口,window_shape=(3, 3)。
  • axis: 可选参数,指定应用窗口的轴。如果为None(默认),则窗口应用于所有轴。
  • subok: 如果为True,子类会传递。
  • writeable: 如果为True,返回的视图是可写的。

优化实现示例

我们使用与之前手动实现相同的原始数组和填充逻辑,然后展示如何用sliding_window_view来实现。

import numpy as np
from numpy.lib.stride_tricks import sliding_window_view

# 示例二维数组 (与手动实现保持一致)
median_x_array = np.random.rand(5, 5)
window_size = 3

# 首先进行填充,与手动实现保持一致
padded_array_auto = np.pad(median_x_array, pad_width=1, mode='wrap')

print("填充后的数组 (用于 sliding_window_view):\n", padded_array_auto)

# 使用 sliding_window_view 生成滑动窗口视图
# window_shape=(window_size, window_size) 表示一个3x3的窗口
rolling_views = sliding_window_view(padded_array_auto, window_shape=(window_size, window_size))

# rolling_views 的形状分析:
# 如果原始填充数组形状为 (M, N),窗口形状为 (W_row, W_col),
# 那么 rolling_views 的形状将是 (M - W_row + 1, N - W_col + 1, W_row, W_col)。
# 例如,对于 (7,7) 的填充数组和 (3,3) 的窗口,结果是 (7-3+1, 7-3+1, 3, 3) = (5, 5, 3, 3)。
print("\n使用 sliding_window_view 生成的视图形状:", rolling_views.shape)

# 将前两个维度(窗口的行和列位置)展平,以便逐个访问每个3x3窗口
# 结果将是一个 (窗口总数, window_size, window_size) 的数组
# 如果需要将每个窗口展平为1D数组,可以进一步 reshape
all_windows_flattened_auto = rolling_views.reshape(-1, window_size * window_size)

# 如果需要,可以对每个窗口应用函数(例如,计算中位数)
# 这里我们只是将其展平并存储,与原始问题保持一致
median_x_neighbors_auto = all_windows_flattened_auto.tolist() # 转换为列表以便与手动实现比较

print("\n使用 sliding_window_view 实现的前3个滑动窗口(展平):\n", median_x_neighbors_auto[:3])
print("使用 sliding_window_view 实现的滑动窗口总数:", len(median_x_neighbors_auto))

# 示例:直接对所有窗口计算中位数
# np.median 函数可以沿着指定的轴进行计算
# axis=(-2, -1) 表示对最后两个维度(即每个3x3窗口内部的元素)进行中位数计算
medians_per_window = np.median(rolling_views, axis=(-2, -1))
print("\n每个窗口的中位数结果:\n", medians_per_window)
print("中位数结果的形状:", medians_per_window.shape)

通过sliding_window_view,我们一步就得到了所有滑动窗口的视图。后续的聚合操作(如计算中位数、均值等)可以直接在rolling_views上使用NumPy的聚合函数完成,通常指定axis=(-2, -1)来对每个窗口内部的元素进行操作。

注意事项与总结

  1. 视图而非副本:sliding_window_view返回的是一个视图,这意味着它不复制原始数据。修改视图中的元素会同时修改原始数组中的相应位置。这对于内存效率非常有利,但也需要在使用时注意,避免意外修改原始数据。如果需要独立副本,请使用.copy()方法。
  2. 填充(Padding):sliding_window_view本身不提供填充功能。如果需要处理数组边缘的窗口(即窗口部分或全部超出数组边界),必须在调用sliding_window_view之前使用np.pad对原始数组进行适当的填充。填充模式(如'constant'、'reflect'、'wrap'等)应根据具体应用场景选择。
  3. 窗口形状与维度:window_shape参数必须与你希望的窗口维度匹配。对于二维数组上的3x3窗口,应设置为(3, 3)。对于更高维度的数组,可以指定多维窗口。
  4. 性能优势:sliding_window_view的性能优势在于其基于stride tricks的实现,它通过改变数组的步长来“虚拟”地创建窗口,避免了大量的数据复制和Python层面的循环,从而显著提高了大型数组滑动窗口操作的效率。
  5. 后续处理:一旦获得rolling_views,可以利用NumPy强大的广播和聚合功能,对所有窗口进行并行处理,例如np.mean(rolling_views, axis=(-2, -1))计算每个窗口的平均值,或者rolling_views.reshape(-1, window_size * window_size)来获取所有展平的窗口。

通过本文的介绍,您应该已经掌握了在Python中使用NumPy的sliding_window_view函数高效执行二维数组滑动窗口操作的方法。这种方法不仅代码简洁,而且在处理大规模数据时能提供显著的性能提升,是进行科学计算和数据分析的强大工具

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

46

2025.09.03

go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

46

2025.09.03

css中的padding属性作用
css中的padding属性作用

在CSS中,padding属性用于设置元素的内边距。想了解更多padding的相关内容,可以阅读本专题下面的文章。

133

2023.12.07

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

31

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

10

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

32

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

1

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

3

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

8

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号