不知道看到这里,读者有么有发现,前面讲了那么多方法,几大检验,回归分析,方差分析“都有一个共同的特点,那就是有一定的前提假设,只有满足这个假设时,模型才有较好的效果.我们可以来回顾一下:
线性回归
因变量呈正态分布,齐方差性,独立,与自变量是线性关系,无离群点。
方差分析
因变量呈正态分布,各组齐方差还有其他的回归斜率相同等等
T检验
独立,来自正态总体;或者非独立,组间差异服从正态分布。
可能你会说,如果不满足正态假设,我们可以改用非参数的检验方法,比如拟合优度检验,秩和检验和符号秩检验,或者Kruskal-Wallis检验,Friedman检验.这些检验是非参数检验,但是若样本量比较小,这些检验往往效果不太好。
于是,今天给大家介绍另外一种检验方法—-置换检验.和自助法(bootstrap)
置换检验
1.与参数方法相同计算统计量记做t0
2.将所有样本放在一个组,然后随机的分配到两个组中,再计算统计量记做t(1)
3.重复2操作,直至将多有可能的组合都弄完,得到一系列的统计量t(1)到t(n)
4.讲这n个统计量按从小到大排序,组成其经验分布,然后,看t0是否落在经验分布的中间95%区间内,若在0.05的显著性水平下,t0落在中间95%区间之外,则拒绝原假设:
若第3步是将所有的可能都计算了,则称为精确检验
若第3步是将部分组合计算了,则称为近似分布,一般用蒙特卡洛模拟.
R实现:
看到两种方法还是有区别的,一个拒绝原假设,一个没有拒绝.
这里是一样的,因为秩和检验默认就是精确检验。
得到的结果基本一致。
我们发现置换法也可以处理有序的因子.它默认线性趋势分析。
通过置换的方达.我们解决了总体分布未知,样本量太小,有离群点的困惑(如果你在问,为什么置换一下就可以忽视这些假设了? 问的好,真的需要这样的想法,虽然这里我给不了解答,但你可以自己去查询)但是,置换法有一个缺点或者叫不足吧,那就是获取置信区间和估计测量精度很难.这时我们便用到另一种非参数方法—自助法。
自助法
1.从样本中随机有放回的抽样的到自助样本
2.计算统计量
3,重复步骤1和2得n个统计量,并从小到大排序.
4,在0.05显著性水平下,找出中间95%区间就是置信区间,在这区间之外的就是拒绝域(这和置换法最后一步是一样的)。
R实现:
原来的R^2是0.7809在使用自助法之后,百分位方法的置信区间是(0.6724,0.8757)使用调整偏差方法后是(0.6158,0.8538)
由于,lmperm包在R中已经不能用了,所以线性回归和方差分析的置换法,没有做,如果有读者知道怎么安装lmperm包,或者代替包,给我留言,非常感谢!
未
完
待
续