统计简单学_假说检定

2019-05-26 21:45:48 浏览数 (1)

估计与假说检定的关系

盒子里共100个球,20个白球,80个黑球,这是总体。

取样10个,2白8黑,预测盒子白球占比20%,这叫做估计,是由样本情况推测群体情况。 取样10个,2白8黑,别人说全是白球,通过样本的数据推翻了别人对于群体的猜测,这叫做假说检定。

统计检定介绍

定义

根据样本信息,检验一个或者多个群体参数值之假说。

步骤

假说的设立

假说检定的种类

型一与型二误差

检定统计量

弃却域与临界值

弃却域的范围是依据单尾或者双尾检定以及预先设置的显著水准(型一误差)设定的。

一个群体参数的统计检定

群体平均数μmu检定

群体μmu的检定

P值

检定μmu的PP值

群体比率PP检定

两个群体参数的统计检定

独立群体与配对群体

检定流程

两独立群体变异数检定

两独立群体平均数检定

两配对群体平均数检定

例子

两独立群体平均数检定_方差同

两独立群体平均数检定_方差异

两配对群体平均数

R实践

代码语言:javascript复制
#单个群体
#单群体平均数检定
x <- c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170)
t.test(x,mu=225,alternative = "greater")
#单群体比率检定
prop.test(83,100,.75,conf.level=.9)
binom.test(83,100,.75,conf.level = .9)
#单群体的方差检定
#############
#小学生的身高
x <- c(136,144,143,157,137,159,135,158,147,165,158,142,159,150,156,152,140,149,148,155)
#计算p值的函数。 cdf为构造的分布,x为分布的参数,side=-1 备择假设less,0双侧检验,1备择假设greater
pValue <- function(cdf, x, paramet=numeric(0), side=0){
  n <- length(paramet)
  P <- switch(n 1,
              cdf(x),
              cdf(x, paramet),cdf(x, paramet[1], paramet[2]),
              cdf(x, paramet[1], paramet[2], paramet[3])
  )
  if(side<0){
    P
  }else if(side>0){
    1-P
  }else{
    if(P<1/2){
      2*P
    }else{
      2*(1-P)
    }
  }
}
#单组方差检定
myVar.testP <- function(x, sigma2=1, mu=Inf, side=0){
  n <- length(x)
  if(mu<Inf){
    S2 <- sum((x-mu)^2)/n; df=n
  }else{
    S2 <- var(x); df=n-1
  }
  chi2 <- df*S2/sigma2
  P <- pValue(pchisq, chi2, paramet=df, side=side)
  data.frame(var=S2, df=df, chisq2=chi2, P_value=P)
}
myVar.testP(x,sigma2=75)
myVar.testP(x,sigma2=75,mu=149)
#############


#两个群体
#双群体的方差检定
var.test(x,y)
#方差相同,两独立群体平均数检定,构造服从n1 n2-2自由度的t统计量,服从t分布
x <- c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
y <- c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)
t.test(x,y,var.equal = T,alternative = "less")
#方差不同,两独立群体平均数检定
t.test(x,y,var.equal = F,alternative = "less")
#两配对群体平均数检定
t.test(x-y,alternative = "less")

回顾

0 人点赞