时间序列分析需先可视化与统计诊断识别趋势、季节性及平稳性,再通过差分、对数变换等预处理使数据适合建模,最后依问题类型选择arima、prophet或指数平滑等模型,并用时间划分法评估。

时间序列分析的核心,是把数据看作随时间变化的有序序列,而不是一堆独立的点。关键在于理解“顺序”和“依赖”——前一时刻的状态往往影响后一时刻的表现。所以第一步不是急着建模,而是先让数据“开口说话”:它有没有趋势?是否随季节重复?波动是不是越来越剧烈?这些特征决定了后续该用平滑、差分,还是直接拟合ARIMA或 Prophet。
看清数据长什么样:可视化 + 统计诊断
画图是最直接的起点。用 plt.plot(df['value']) 看整体走势;叠加滚动均值(df['value'].rolling(12).mean())能凸显趋势;画年度子图(比如按月份分组再画多条线)可判断季节性。接着做统计验证:用 adfuller() 检查平稳性,p 值小于 0.05 才算基本平稳;用 plot_acf() 和 plot_pacf() 观察滞后相关结构,这对确定 ARIMA 的 p、q 参数很实用。
让数据变得“好建模”:预处理常见操作
-
处理缺失值:时间序列不建议简单删行。优先用前向填充(
ffill)、线性插值(interpolate(method='linear')),或根据周期用同周几均值填充 -
对齐频率:用
resample('D').mean()转成日频,注意补缺时明确填法(如fill_method='pad') -
稳定方差:若波动随均值增大(比如销量越高抖动越大),试试对数变换
np.log1p(x),比直接 log 更稳妥 -
消除趋势与季节性:一阶差分(
diff())常用于去趋势;对月度数据,可做“同比差分”(当前值减去年同月)来弱化季节效应
选模型前先想清楚:问题类型决定方法路径
预测未来几步?关注短期精度就用 SARIMAX 或 LightGBM + 时间特征(小时、星期几、是否节假日);预测长期趋势并需解释?Prophet 更友好,内置节假日和变点检测;数据量小又带强周期?先试指数平滑(ExponentialSmoothing),参数少、不易过拟合。别一上来就上深度学习——LSTM 在小样本或噪声大时未必比得过一个调好的 ARIMA。
10分钟内自己学会PHP其中,第1篇为入门篇,主要包括了解PHP、PHP开发环境搭建、PHP开发基础、PHP流程控制语句、函数、字符串操作、正则表达式、PHP数组、PHP与Web页面交互、日期和时间等内容;第2篇为提高篇,主要包括MySQL数据库设计、PHP操作MySQL数据库、Cookie和Session、图形图像处理技术、文件和目录处理技术、面向对象、PDO数据库抽象层、程序调试与错误处理、A
评估不能只看 RMSE:时间序列有特殊陷阱
用时间划分训练/测试集(如前80%训练,后20%预测),绝不用随机切分,否则会泄露未来信息。多步预测时,逐点误差(forecast[i] vs actual[i])和累积误差(比如预测7天总和 vs 实际总和)都要看。如果业务更关心“方向是否对”,就加个方向准确率(DA)指标:预测值与实际值变化符号一致的比例。
立即学习“Python免费学习笔记(深入)”;









