一年一度的双11,我们喜欢买买买,更乐意看到全民双11会创作怎样的销售奇迹。2019年是第11个双11,希望我们的梦想一一实现,再创销售奇迹。
等不及,我们一起预测2019天猫双11销售额。
注释:times代表第几次,gmv代表销售额
1,历年销售预览:
2,简单的折线图:
3,绘制散点图:
看一看次数与销售额的的关系,可以看一个有坡度弯曲的曲线,如果强行采用一元线性回归,开预测第11次双11的销售额(GMV)会低估。
代码语言:javascript复制>tianmao <- data.frame(times=c(1,2,3,4,5,6,7,8,9,10),
gmv=c(0.5,9.36,52,191,350,571,912,1207,1682,2135));
> library('car')> library(carData)> scatterplot(gmv~times, data=tianmao,spread=F,lty.smooth=1, pch=18, xlab="times",ylab="gmv",cex.lab=0.7, family = 'SimSun')
#很高的相关性
> cor(tianmao[,1],tianmao[,2])[1] 0.9517394
4,预测开始:
4.1,用一元线性回归预测(我知道上图看明显是曲线,因为数量小,可以试试预测值)
代码语言:javascript复制tianmao <- data.frame(times=c(1,2,3,4,5,6,7,8,9,10),
gmv=c(0.5,9.36,52,191,350,571,912,1207,1682,2135));
> md<-lm(gmv~times, data=tianmao)
得到线性预测函数:
代码语言:javascript复制x0<-data.frame(times=11)
predict(md, newdata=x0)
预测2019年,第11次的销售额gmv=2013.585。
代码语言:javascript复制predict(md, x0, interval="confidence", level=0.95)
在置信度为95%的条件下预测gmv区间:[1627.233, 2399.937]
4.2,非线性的广义相加模型预测,对非线性的拟合会好一点
代码语言:javascript复制> library(mgcv)
> library(nlme)
> model <-gam(gmv~s(times),data = tianmao)
> summary(model)
>x0<-data.frame(times=11)
> predict(model, newdata=x0)
1
2583.387
预测2019年,第11次的销售额gmv= 2583.387。
5,结合一元线性回归模型的预测 和 相加模型的预测
提前恭喜天猫2019年第11次双11大卖
天猫销售额保底:2013.585亿
有望创作新高:2583.387亿
最可能的销售额:2298.486亿