估计与假说检定的关系
盒子里共100个球,20个白球,80个黑球,这是总体。
取样10个,2白8黑,预测盒子白球占比20%,这叫做估计,是由样本情况推测群体情况。 取样10个,2白8黑,别人说全是白球,通过样本的数据推翻了别人对于群体的猜测,这叫做假说检定。
统计检定介绍
定义
根据样本信息,检验一个或者多个群体参数值之假说。
步骤
假说的设立
假说检定的种类
型一与型二误差
检定统计量
弃却域与临界值
弃却域的范围是依据单尾或者双尾检定以及预先设置的显著水准(型一误差)设定的。
一个群体参数的统计检定
群体平均数μmu检定
群体μmu的检定
P值
检定μmu的PP值
群体比率PP检定
两个群体参数的统计检定
独立群体与配对群体
检定流程
两独立群体变异数检定
两独立群体平均数检定
两配对群体平均数检定
例子
两独立群体平均数检定_方差同
两独立群体平均数检定_方差异
两配对群体平均数
R实践
代码语言:javascript复制#单个群体
#单群体平均数检定
x <- c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170)
t.test(x,mu=225,alternative = "greater")
#单群体比率检定
prop.test(83,100,.75,conf.level=.9)
binom.test(83,100,.75,conf.level = .9)
#单群体的方差检定
#############
#小学生的身高
x <- c(136,144,143,157,137,159,135,158,147,165,158,142,159,150,156,152,140,149,148,155)
#计算p值的函数。 cdf为构造的分布,x为分布的参数,side=-1 备择假设less,0双侧检验,1备择假设greater
pValue <- function(cdf, x, paramet=numeric(0), side=0){
n <- length(paramet)
P <- switch(n 1,
cdf(x),
cdf(x, paramet),cdf(x, paramet[1], paramet[2]),
cdf(x, paramet[1], paramet[2], paramet[3])
)
if(side<0){
P
}else if(side>0){
1-P
}else{
if(P<1/2){
2*P
}else{
2*(1-P)
}
}
}
#单组方差检定
myVar.testP <- function(x, sigma2=1, mu=Inf, side=0){
n <- length(x)
if(mu<Inf){
S2 <- sum((x-mu)^2)/n; df=n
}else{
S2 <- var(x); df=n-1
}
chi2 <- df*S2/sigma2
P <- pValue(pchisq, chi2, paramet=df, side=side)
data.frame(var=S2, df=df, chisq2=chi2, P_value=P)
}
myVar.testP(x,sigma2=75)
myVar.testP(x,sigma2=75,mu=149)
#############
#两个群体
#双群体的方差检定
var.test(x,y)
#方差相同,两独立群体平均数检定,构造服从n1 n2-2自由度的t统计量,服从t分布
x <- c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
y <- c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)
t.test(x,y,var.equal = T,alternative = "less")
#方差不同,两独立群体平均数检定
t.test(x,y,var.equal = F,alternative = "less")
#两配对群体平均数检定
t.test(x-y,alternative = "less")