0

0

如何用Python实现数据平滑?移动平均处理

星夢妙者

星夢妙者

发布时间:2025-07-14 14:29:02

|

743人浏览过

|

来源于php中文网

原创

移动平均是一种常用的数据平滑方法,通过计算连续数据点的平均值来减少噪声并突出趋势。python中可用numpy和pandas实现,如使用np.convolve或pd.series.rolling().mean()进行简单移动平均(sma),以及pd.series.ewm().mean()进行指数移动平均(ema)。窗口大小的选择需根据数据周期性、实际效果及领域知识调整,过小则平滑不足,过大则可能丢失特征。移动平均的变种包括:1. sma所有点权重相同;2. 加权移动平均(wma)为不同点分配不同权重;3. ema权重呈指数衰减,更关注近期数据。其他平滑方法还有:savitzky-golay滤波器、小波变换、卡尔曼滤波和loess,各自适用于不同场景,如保留局部特征、系统状态估计或未知分布数据。

如何用Python实现数据平滑?移动平均处理

数据平滑,简单来说,就是减少数据中的噪声,让趋势更明显。Python有很多库可以做到这一点,移动平均是其中一种比较简单且常用的方法。

如何用Python实现数据平滑?移动平均处理

移动平均处理,就是用一系列连续数据点的平均值来代替原始数据点。这能有效过滤掉短期波动,突出长期趋势。

解决方案:

立即学习Python免费学习笔记(深入)”;

如何用Python实现数据平滑?移动平均处理
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

def moving_average(data, window_size):
  """
  计算移动平均。

  Args:
    data: 原始数据,列表或NumPy数组。
    window_size: 窗口大小,即用于计算平均值的连续数据点数量。

  Returns:
    移动平均后的数据,列表。如果窗口大小大于数据长度,返回空列表。
  """
  if window_size > len(data):
    return [] # 处理窗口过大的情况

  # 使用NumPy进行优化
  data_as_array = np.asarray(data)
  window = np.ones(window_size) / window_size
  smoothed_data = np.convolve(data_as_array, window, mode='valid')
  return smoothed_data.tolist()


# 示例数据
data = [1, 2, 3, 4, 5, 4, 3, 2, 1, 2, 3, 4, 5]

# 设置窗口大小
window_size = 3

# 计算移动平均
smoothed_data = moving_average(data, window_size)

# 打印结果
print("原始数据:", data)
print("移动平均后的数据:", smoothed_data)

# 可视化
plt.plot(data, label='Original Data')
plt.plot(smoothed_data, label='Moving Average (Window Size = {})'.format(window_size))
plt.legend()
plt.xlabel('Data Point Index')
plt.ylabel('Value')
plt.title('Moving Average Smoothing')
plt.show()


# 使用Pandas实现更灵活的移动平均

# 创建Pandas Series
data_series = pd.Series(data)

# 计算简单移动平均 (SMA)
window_size_pandas = 3
sma = data_series.rolling(window=window_size_pandas).mean()
sma = sma.dropna() # 删除NaN值,因为前几个数据点无法计算均值

print("\nPandas SMA:", sma.tolist())

# 计算指数移动平均 (EMA)
ema = data_series.ewm(span=window_size_pandas, adjust=False).mean() # adjust=False 更稳定
print("Pandas EMA:", ema.tolist())


# Pandas可视化
plt.figure(figsize=(10, 6))
plt.plot(data, label='Original Data')
plt.plot(sma, label='SMA (Window Size = {})'.format(window_size_pandas))
plt.plot(ema, label='EMA (Span = {})'.format(window_size_pandas))
plt.legend()
plt.xlabel('Data Point Index')
plt.ylabel('Value')
plt.title('Pandas Moving Average Smoothing')
plt.show()

移动平均的窗口大小如何选择?

窗口大小的选择至关重要。太小,平滑效果不明显;太大,可能会过度平滑,丢失重要特征。 一般来说,可以根据数据的周期性来选择窗口大小。例如,如果数据存在明显的季节性,可以尝试将窗口大小设置为季节周期长度。 也可以通过尝试不同的窗口大小,观察平滑效果,然后选择一个合适的。 还可以结合领域知识来判断。

Uni-CourseHelper
Uni-CourseHelper

私人AI助教,高效学习工具

下载
如何用Python实现数据平滑?移动平均处理

移动平均有哪些变种?它们有什么区别

移动平均有很多变种,常见的有:

  • 简单移动平均 (SMA):所有数据点的权重相同。上面代码示例已经展示。
  • 加权移动平均 (WMA):数据点的权重不同,通常越靠近当前时间点的数据权重越高。
  • 指数移动平均 (EMA):也是一种加权移动平均,但权重呈指数衰减。EMA 对最近的数据点更敏感,反应速度更快。Pandas的ewm函数可以实现EMA。

SMA简单易懂,但对所有数据点一视同仁,可能无法很好地反映趋势变化。WMA和EMA则更加灵活,可以根据实际需求调整权重,更好地捕捉趋势。EMA的计算效率通常比WMA更高。

除了移动平均,还有哪些其他数据平滑方法?

除了移动平均,还有很多其他数据平滑方法,例如:

  • Savitzky-Golay 滤波器:这是一种基于多项式拟合的滤波器,可以在平滑数据的同时,保留数据的局部特征。SciPy库提供了savgol_filter函数来实现Savitzky-Golay滤波。
  • 小波变换:小波变换可以将数据分解成不同频率的成分,然后可以对不同频率的成分进行处理,从而实现数据平滑。PyWavelets库提供了小波变换的功能。
  • 卡尔曼滤波:卡尔曼滤波是一种递归的滤波算法,可以用于估计系统的状态。卡尔曼滤波需要建立系统的状态空间模型,并假设噪声服从高斯分布。
  • LOESS (Locally Estimated Scatterplot Smoothing):LOESS是一种非参数的回归方法,它通过局部加权回归来平滑数据。 statsmodels库提供了LOESS的实现。

选择哪种平滑方法取决于数据的特点和具体需求。如果数据噪声较大,且对平滑效果要求较高,可以考虑使用Savitzky-Golay滤波器或小波变换。如果需要对系统状态进行估计,可以考虑使用卡尔曼滤波。如果数据分布未知,可以考虑使用LOESS。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

56

2025.12.04

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

406

2023.08.14

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

9

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

105

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

13

2026.01.26

苹果官方查询网站 苹果手机正品激活查询入口
苹果官方查询网站 苹果手机正品激活查询入口

苹果官方查询网站主要通过 checkcoverage.apple.com/cn/zh/ 进行,可用于查询序列号(SN)对应的保修状态、激活日期及技术支持服务。此外,查找丢失设备请使用 iCloud.com/find,购买信息与物流可访问 Apple (中国大陆) 订单状态页面。

111

2026.01.26

npd人格什么意思 npd人格有什么特征
npd人格什么意思 npd人格有什么特征

NPD(Narcissistic Personality Disorder)即自恋型人格障碍,是一种心理健康问题,特点是极度夸大自我重要性、需要过度赞美与关注,同时极度缺乏共情能力,背后常掩藏着低自尊和不安全感,影响人际关系、工作和生活,通常在青少年时期开始显现,需由专业人士诊断。

5

2026.01.26

windows安全中心怎么关闭 windows安全中心怎么执行操作
windows安全中心怎么关闭 windows安全中心怎么执行操作

关闭Windows安全中心(Windows Defender)可通过系统设置暂时关闭,或使用组策略/注册表永久关闭。最简单的方法是:进入设置 > 隐私和安全性 > Windows安全中心 > 病毒和威胁防护 > 管理设置,将实时保护等选项关闭。

6

2026.01.26

2026年春运抢票攻略大全 春运抢票攻略教你三招手【技巧】
2026年春运抢票攻略大全 春运抢票攻略教你三招手【技巧】

铁路12306提供起售时间查询、起售提醒、购票预填、候补购票及误购限时免费退票五项服务,并强调官方渠道唯一性与信息安全。

111

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号