什么是随机序列
一般统计的理论基础是概率论,而时间序列比较特殊,它的理论基础是随机过程。想透彻的理解时间序列,应该从根本、从随机过程的角度去理解时间序列。
随机变量本身的状态是随机变化的,但是这种变化往往会受到其他因素的干扰,例如一个标准大气压下,水的分布会随着大气压的变化形成一系列的随机变化,0度的水为固态,100度的水为气态,这一系列的变化即为随机过程。
时间序列模型的机制
时间序列模型的建模机制涉及随机过程的分类,即:
- 独立随机过程
独立随机过程在现实中比较难找
- 独立增量随机过程
独立增量随机过程,例如泊松分布,即观察窗前经过的人群可以发现,每一个时刻增加的人数都是独立的。国外银行的排队人数系统便是依据增量随机过程而设计的
- 马尔科夫过程
马尔科夫过程可以理解为,现在的状态只与过去的状态有关,与之前的状态无关,即昨天影响今天,今天影响明天。再例如排队时,你排队的耗时受到前面的人的影响,而你,又会去影响后面的人的排队速度。通常,在战略咨询与品牌咨询场景中,马尔科夫过程用到的较多
- 平稳随机过程
时间序列模型的基本思想为利用过去对现在的影响,去预测未来,因此要保证过去对现在的影响与现在对未来的影响一致,即平稳随机过程。所谓的平稳指的是统计特性不随着时间的推移而改变,即同质。严格些平稳过程要求分布平稳,宽松些的平稳过程要求均值为常数
品牌战略模型怎么做
经常听到的高大上的品牌战略分析模型其实并不复杂,可以使用马尔科夫过程去简单的实现,例如:
在北京朝阳商业街只有海底捞、呷哺与井格三家火锅店,如果今年2月份去吃三家火锅的人数为4800、3200与8000人。今天3月份发现:
- 原本去吃海底捞的人中有480人转身去吃了呷哺、有960人转身去吃了井格;
- 原本去吃呷哺的人中有320人转身去吃了海底捞、有640人转身去吃了井格;
- 原本去吃井格的人中有640人转身去吃了海底捞、有320人转身去吃了呷哺。
依据上述数据便可以得到三家店铺的转移矩阵以及转移概率矩阵,以此便能够分析出今年三月份该地区三家火锅品牌店的市场占有率、今年12月份的市场占有率以及按照当前客流趋势下三家火锅品牌店长期的市场占有率。
时间序列模型影响产品周期
时间序列模型与产品的生命周期息息相关,如果不能正确判断产品的生命周期、不能对销售需求与销量进行合理的预测,便会造成库存增加、利润下滑以及亏损等一系列连锁的反应,这也是很多产品销路不佳的原因之一。
产品周期分析思路
一般,进行产品周期预测可以尝试从三方面着手,即:
- 首先是门店分群;
- 其次是季前预测;
- 最后是季中预测
依据预测数据进行销售指导, 从而形成商品计划、供应链、物流系统以及门店运营的大闭环。
时间序列模型建模步骤
时间序列建模步骤以ARIMA模型为例,获得观察值序列后,需要进行平稳性检验,如样本非平稳,那么需要通过差分将序列变为平稳;序列平稳后再进行白噪声检验,通过检验后即可得到分析结论。
如果想获得平稳、非噪声序列,那么残差必须为噪声,ARIMA模型构建过程中最难的挑战当属自相关、偏自相关图形的查看,SAS中的minic参数可以为阶数选择提供建议,但是仅仅是建议而已,不可以完全依赖,实际中还是需要结合自相关与偏自相关图进行综合考量。
时间序列最怕什么
所有模型中,时间序列的建模流程属于较简单的,但是需要知道,时间序列模型最怕两个地方:
- 害怕异常值
时间序列模型非常恐惧异常值,所以建模前需要先弄清楚是真正的异常还是该点出现了某个特殊的事件,如果是真正的异常需要将其剔除,如果该点发生了什么事件则需要弄清楚具体的原因后,再进行下一步的分析。
- 害怕差分太多次
由于时间序列非平稳有均值非平稳与方差非平稳两种情况,对于方差非平稳则必须使用条件异方差模型,而通常所说的非平稳一般指的是均值非平稳,用差分的方法进行处理就可以了。但是需要注意,差分阶数越高方差也会随之呈几何增长,即方差会增大,通常,我最高进行2阶差分,也就是说,如果2阶差分还没有平稳,那么我不会再往下进行3阶差分了,而是选择进行log变换,如果,序列还是无法达到平稳的状态,那么,放弃使用ARIMA模型吧,只能尝试下指数平滑法了。