数学建模学习笔记(二十一)时间序列小白指南(上)

2022-06-14 09:51:41 浏览数 (1)

时间序列这块内容,搜索各种博客,很少有对于初学者友好的内容,各种术语云烟雾绕,不胜其解。此篇内容将其他一些资料加以整理,不提晦涩的数学推导,只描述其如何应用,若有不对之处,烦请在评论区指出

  1. 什么是时间序列? 简单的来说,就是一组数据随时间的变化。通过时间序列可以进行预测。
  2. 关于预测类模型的补充: ①时间序列预测: 适用场景:国民经济市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。 ②神经网络预测:一种非线性模型 适用于大样本的预测问题 ③回归分析预测: 适用场景:样本数量较少,自变量与因变量间的变化具有明显的逻辑关系 ④马尔科夫预测: 适用场景:主要用于市场占有率的预测和销售期望利润的预测以及其他商业领域的预测等 本篇描述的就是第一种的时间序列预测
  3. 分类: 1.变动形态分类: 一般分为四种:长期趋势变动,季节变动,循环变动,不规则变动。 2.方法分类: (1) 平均数预测(简单算术平均法,加权算术平均法,几何平均数法) (2) 移动平均数预测(一次移动平均法,二次移动平均法) (3) 指数平滑法预测(一次,二次,三次指数平滑法) (4) 趋势法预测(分割平均法,最小二乘法,三点法) (5) 季节变动法(简单平均法,季节比例法)
  4. 常见模型 1、自回归模型(AR) 使用条件: 描述当前值与历史值之间关系,用变量自身的历史数据对自身进行预测; 必须具有自相关性,如果自相关系数小于0.5,不宜采用; n阶自回归公式:

其中Y是预测对象的观测值,Z为误差。作为预测对象Yt受到自身变化的影响 简单的说,AR就是自己和自己的过去比较进行预测 2、移动平均模型(MA) 特点: 关注自回归模型中的误差项的累加; 能有效消除预测中的随机波动; q阶滑动平均:

简单来说,就是自己是自己过去扰动的线性组合 看到扰动,也许会糊涂,我的理解是,可以看作人的一生,AR是自己该时刻由自己过去所有状态决定,MA是自己该时刻由自己过去其他人对自己的影响决定 3、自回归移动平均模型(ARMA) 很简单,考虑全面,将上述两个组合一下; 任何一个 ARMA 模型都是一个线性差分方程:

4、差分整合移动平均自回归模型(ARIMA ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为滑动平均,q为滑动平均项数,d为使之成为平稳序列所做差分次数(阶数)。 比上个ARMA,加上的I就是微分次数,为什么要微分?后面会说

所以整体看来,ARIMA是上面模型的完全体,一般就用ARIMA模型,下面就介绍ARIMA模型的建模步骤

  1. ARIMA模型的建模步骤:

下面将介绍平稳性检验和白噪声检验的具体方法,在此之前,先放上几个概念,后面会用到:

  1. 几个重要概念: 1、自相关函数ACF 自回归有序的随机变量序列与其自身相比较,自相关函数反映了同一序列在不同时序的取值之间的相关性

其中k代表滞后期数 2、偏自相关函数PACF 偏自相关函数PACF描述的是在给定中间观测值的条件下,时间序列观测值预期过去的观测值之间的线性相关性。 简单理解,PACF可认为ACF求导 (ACF衡量了Xt与Xt-k之间的关系,但相关系数掺杂了其他变量对Xt 与Xt-k的影响。 计算某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视为常数,即暂不考虑其他要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,称为偏相关。即为单纯测量Xt与Xt-k的关系,引进了PACF的概念。 3、拖尾和结尾 拖尾指序列以指数率单调递减或震荡衰减,而截尾指序列从某个时点变得非常小:

4、模型识别:

  1. 平稳性检验 (1)什么是平稳序列? 如果时间序列在某一常数附件波动且波动范围有限,即具有常数均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的,则称该序列为平稳序列。 (2)怎么检验? 方法一:图检验 时序图检验:在某一常数附近波动且波动范围有限。 自相关图检验:平稳序列具有短期相关性,但随着延迟期数k的增加,自相关系数会快速衰减趋向于零。 方法二:单位根检验 不存在单位根即是平稳序列。
  2. 白噪声检验 (1)什么是白噪声? 白噪声即纯随机序列,那么序列值之间没有任何关系,则自相关系数为零(理论)或接近于零 (实际)。 (2)检验纯随机性 方法一:图检验 自相关图检验:自相关系数为零或接近于零 QQ图检验:大部分点在直线上,则数据符合正态分布 方法二:DW检验或LB统计量检验

整理到这里,发现篇幅有些长了,实例和matlab代码会放置在本专栏后两篇

arm

0 人点赞