此部分仅仅是告诉你怎样用Tableau做这个模型,如果想要更加深刻的了解可以去看专门的统计学课程。
41、回归分析
回归分析:本质上是讲存在及可能存在的相关关系的变量拟合成直线或者曲线。据此,我们一方面可以总结出已有数据的规律和特征,另一方面还可以预测数据。
1、简单的线性回归模型
步骤: ①人工服务接听量->列,呼入案头总时长->列;分析->取消聚合度量
②添加回归分析:直接右键->趋势线->显示趋势线
回归方程如上,R值越大越好,越大越拟合越有关联性,p值越小越好,p值决定了可信程度 添加趋势线的几种方法: 1、直接右键->趋势线->显示趋势线 2、分析->趋势线->显示趋势线 3、右侧分析->模型->趋势线
如果想看描述趋势线: 步骤:右键趋势线->描述趋势线
如果把描述趋势线添加到图中,可以复制描述趋势线内的内容。
2、其他的几种回归分析模型:
我们可以在工作界面中点击右键->趋势线->编辑趋势线——>选择其他的几种回归模型
1、对数模型
2、指数模型
根据上图我们看到从140到后面增长曲线明显增加,这时有人可能会认为拟合度不好,但是其实其拟合度要比上一种更好,这时为什么呢?因为后面的那部分量非常的少,对整个的拟合结果影响非常的小。 下面可以举例说明: 创建一个计算字段:人工服务接听量->右键->创建字段;人工服务接听量异常区分->颜色
我们可以看到前半部分数据所占比重占大头,同时我们可以看下正常数据和异常数据的所占比:
由上图我们可以看出异常数据对于曲线的拟合产生的影响很小。在统计里通常6%或者更小的3%的数据可以忽略不计。 如果还不明白,我们可以通过创建参数来对比观察: 步骤:1、右键左侧空白处->创建参数->自定义参数,如下图所示
2、修改下计算字段
然后我们进行对比查看: 当处于80时,异常数据占13.19%
当处于130时,异常数据占2.40%
除了以上对不,我们还可以通过添加趋势线进行对比: 1、当值为100时
2、当值为140时
这样是不是就很明朗了。
3、幂模型
4、多项式模型
42、时间序列分析
时间序列预测是Tableau内嵌的周期性的预测功能,它能够自动的拟合预测模型,分析数据的变化规律,定量的预测数据,同时也可以对预测模型的参数进行调整,评价预测模型的精度。
1、创建人工服务接听量预测曲线
时间序列本质上是用原始的时间序列数据拟合出模型,分析研究数据的变化发展规律,从而得出观测数据的统计特征,再依据拟合出的模型外推(向后推)一定时间内预测的数值,并且能够自动识别出是以周围周期还是以月为周期等的匹配的情况,可以自动识别出周期性。 步骤: ①先创建基础表:人工服务接听量->行,日期->列(下拉选择天)
②显示初步预测:右键图中空白处->预测->显示预测
③对预测曲线进行编辑:右键->预测->预测选项
但是如果真的选择用零填充缺少值是,结果会出现很大的不同,因此更推荐补全原数据。 如果想更改预测模型选项可以点击下图的内容进行选择:
其中,季节等同周期,如果波动很大,建议选择累乘更好拟合
2、预测模型评价
步骤:右键->预测->描述预测
预测波动:
评价
累加与累成
如果数量集差异较大用累乘
后话:
关于Tableau的入门博客到此结束,由于写的过于仓促,有的知识点并没有完美的展现出来,很抱歉,又因为专业理解还没到一定程度,所以在某些部分可能会存在专业性不强的问题,但是通过此系列博客,还是可以了解到数据可视化软件Tableau的基本使用得。在以后得日子里,博主有可能还会继续更新Tableau得进阶博文。希望大家能够关注下我!