时间序列基础知识

2019-04-23 15:54:09 浏览数 (2)

正文共:2154 字 2 图 预计阅读时间: 6 分钟

前文推送

  1. MIT线性代数相关资源汇总
  2. Pandas可视化(一):pandas.Series.plot

本文目录:

  • 1. 概念
    • 1.1 基本介绍
    • 1.2 时间序列的类型
  • 2. 时间序列的分析方法
    • 2.1 时间序列的分析方法类型
    • 2.2 时域分析方法的分析步骤

1. 基本概念

1.1 基本介绍

所谓时间序列就是按照时间的顺序记录的一列有序数据。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。在日常生产、生活中,时间序列比比皆是,时间序列分析的应用领域非常广泛。

1.2 时间序列的类型

大体上可以将时间序列分为非平稳时间序列(Non-stationary) 和平稳时间序列(stationary)两类。

对于平稳序列,从概念定义上来说我们将它们分为严平稳(strictly stationary)和宽平稳(weak stationary)两类。

严平稳时间序列表示时间序列的分布不随时间的改变而改变。如白噪声(正态分布),无论怎么取,都是期望为0,方差为1 。通常只具有理论意义,在实践中用到更多的是条件比较宽松的宽平稳时间序列。

宽平稳也叫弱平稳或者二阶平稳(均值和方差平稳),相关系数(依赖性,依赖于过去的信息)不变。

不属于上述类别的时间序列我们就称为非平稳时间序列,我们对时间序列的研究主要依赖于平稳序列的性质,因此,对于非平稳时间序列,通常会将他们转化为平稳时间序列后再做分析。

2. 时间序列的分析方法

2.1 时间序列分析方法类型

对于时间序列的分析,主要通过两种方法。

(1)描述性分析

早期的时序分析通常都是通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析。

描述性时序分析方法是人们在认识自然、改造自然的过程中发现的实用方法。对于很多自然现象,只要人们观察时间足够长,就能运用描述性时序分析发现蕴涵在时间里的自然规律。根据自然规律,做恰当的政策安排,就能有利于社会的发展和进步。

描述性分析方法具有操作简单、直观有效的突出特点。它通常也是人们进行统计时序分析的第一步,通过图示的方法直观地反映出序列的波动特征。

(2)统计时序分析

随着研究领域的不断拓广,人们发现单纯的描述性时序分析有很大的局限性。在金融、保险、法律、人口、心理学等社会科学研究领域,随机变量的发展通常会呈现出非常强的随机性,想通过对序列简单的观察和描述,总结出随机变量发展变化的规律,并准确预测出它们将来的走势通常是非常困难的。

为了更准确地估计随机序列发展变化的规律,从20世纪20年代开始,学术界利用数理统计学原理分析时间序列。研究的重心从总结表面现象转移到分析序列值内在的相关关系上,由此开辟了一门应用统计学科——时间序列分析。

统计时序分析又分为两种主要的分析方法:

①频域分析方法

频域(frequency domain)分析方法也被称为“频谱分析”或“谱分析” (spectral analysis)方法。

早期的频域分析方法假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动,借助富里埃分析从频率的角度揭示时间序列的规律,后来又借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数。20世纪60年代, Burg在分析地震信号时提出最大熵谱估计理论,该理论克服了传统谱分析所固有的分辨率不高和频率漏泄等缺点,使谱分析进入一个新阶段,称之为现代谱分析阶段。

目前谱分析方法主要运用于电力工程、信息工程、物理学、天文学、海洋学和气象科学等领域,它是一种非常有用的纵向数据分析方法。但是由于谱分析过程一般都比较复杂,研究人员通常要具有很强的数学基础才能熟练使用它,同时它的分析结果也比较抽象,不易于进行直观解释,所以谱分析方法的使用具有很大的局限性。

②时域分析方法

时域(time domain)分析方法主要是从序列自相关的角度揭示时间序列的发展规律。相对于谱分析方法,它具有理论基础扎实、操作步骤规范、分析结果易于解释等优点。目前它已广泛应用于自然科学和社会科学的各个领域, 成为时间序列分析的主流方法。

时域分析方法的基本思想是事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,而且这种相关关系具有某种统计规律。我们分析的重点就是寻找这种规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。

因此我们通常所说的时间序列分析,就是统计时序分析中的时域分析方法。

2.2 时域分析方法的分析步骤

时域分析方法具有相对固定的分析套路,通常都遵循如下分析步骤:

  1. 第一步: 考察观察值序列的特征。
  2. 第二步: 根据序列的特征选择适当的拟合模型。
  3. 第三步: 根据序列的观察数据确定模型的口径。
  4. 第四步: 检验模型,优化模型。
  5. 第五步: 利用拟合好的模型来推断序列其他的统计性质或预测序列将来的发展。

参考资源:

  • 王燕,《应用时间序列分析》中国人民大学出版社, 2012 .

0 人点赞