一、假设检验
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。其基本原理如下所示:
(1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
(2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过 0.05 的事件称为“小概率事件”,也可视具体情形而取 0.1 或 0.01 等。在假设检验中常记这个概率为 α,称为显著性水平。而把原先设定的假设成为原假设,记作 H0。把与 H0 相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作 H1。
假设的形式
H0——原假设, H1——备择假设
双侧检验:H0:μ = μ0 ,H1:μ ≠ μ0
单侧检验:H0:μ ≥ μ0,H1:μ < μ0 或,H0:μ ≤ μ0, H1:μ > μ0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受 H0,就否定 H1;拒绝 H0,就接受 H1。
零假设检验
二、频数统计与独立性检验
离散型变量通过计算频数,然后进行独立性检验。
代码语言:javascript复制rm(list = ls())
library(vcd)
data(package = 'vcd')
x<-Arthritis
nrow(x)
table(x$Treatment)
table(x$Sex)
table(x$Treatment,x$Sex)
table(x$Improved)
x$Improved[x$Improved == 'Some'] <- 'Marked'
x<-Arthritis
levels(x$Improved)
levels(x$Improved) <- c('None','Marked','Marked')
table(x$Improved)
y <- table(x$Improved,x$Treatment)
chisq.test(y)
fisher.test(y)
z <- table(x$Improved,x$Sex)
chisq.test(z)
fisher.test(z)
写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。
代码语言:javascript复制sx.voiceclouds.cn
有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。