Power BI 的时间序列预测——ARIMA

2021-08-31 16:41:46 浏览数 (2)

除夕夜,祝大家新年快乐、阖家安康、牛转乾坤、学业进步、心想事成!!!

ARIMA

跟指数平滑法(ETS)同样经典的另一个时间序列预测模型是ARIMA(Autoregressive Integrated Moving Average Model,整合移动平均自回归模型)。ARIMA完整模型如下方程所示:

其中,

是时间序列y的N阶差分,当N=1时,即为当期值-上期值,如下图所示:

为了方便显示,完整方程可改写为如下所示:

三个重要参数:

  • p:代表预测模型中采用的时序数据本身的滞后数(lags)
  • d:代表时序数据需要进行几阶差分化,才是稳定的
  • q:代表预测模型中采用的预测误差的滞后数(lags),也叫做MA/Moving Average项

ARIMA(0,0,0)——White Noise

我们首先来考察最极端的情况,即三个参数均为0。此时,由于d为0,所以无需差分,ARIMA方程变为:

即为一个白噪声(White Noise)序列。即序列任何两个时间点的值都不相关,但序列的期望值(均值)为0。无法进行有效的预测。

ARIMA(0,1,0)——Random Walk

此时,d=1,p和q为0,则ARIMA方程为:

即序列的一阶差分为白噪声序列,这种情况下,序列本身成为随机游走序列(Random Walk)。随机游走序列具有以下两个特点:

  • 长期来看具有上升或下降的趋势,取决于常数c,
  • 短期内会突然上升或下降。

为什么要取差分?因为大多数时间序列是非平稳的(即有升降趋势或周期性),但当期和上期的差值(即一阶差分)可能使得序列平稳(不随时间改变),易于预测。当然,往往一阶差分不够,还需要进行二阶差分(此时d=2)。

ARIMA(p,0,0)——AR Model

当d和q为0,且p不为0时,ARIMA模型简化为AR模型(自回归模型),即

或更直观地:

上式的意思是,当期的预测值,是前p期值的回归,因此叫做自回归。

ARIMA(0,0,q)——MA Model

当p和d为0,且q不为0时,ARIMA模型简化为MA模型(移动平均模型),即:

上式的意思是,当期的预测值,是前q期预测值与实际值误差的加权平均数。值得一提的是,MA模型与我们在Power BI里常用的移动平均法是有区别的。后者的英文名称为Moving Averaging Smoothing,译为移动平滑更合适。即当期预测值是前N期实际值的平均值,更接近于AR模型(前p期系数相同且均为1/q)。而MA模型,则是求误差的加权平均。

SARIMA(p,d,q)(P,D,Q)m——季节性ARIMA模型

跟指数平滑法类似,ARIMA也可以包含季节部分。季节部分同样含有三个参数,分别用大写P,D,Q表示。此外还有一个m参数,代表每年有几个观测值。如季度性时间序列,则m=4;月度性时间序列,则m=1。

举例,SARIMA(1,1,1)(1,1,1)44 模型如下所示:

POWER BI中的使用方法

参数这么多的模型,在Power BI中自然是不方便通过DAX来模拟。但是第三方市场上有不少涉及ARIMA模型的视觉对象。我们将在下期,为大家一一解读。敬请收藏~关注~点赞~


注:本文部分公式截图来源于Forecasting: Principles and Pratices. Rob J Hyndman and George Athanasopoulos . https://otexts.com/fpp2/arima.html

0 人点赞