- 假设检验
- 原假设与备择假设
- 显著性水平
- 两类错误
- 单侧检验
- 单个总体均值的假设检验
- 两个总体参数的假设检验
- 匹配样本的假设检验
假设检验
原假设与备择假设
原假设:又叫零假设,指的是待检验的假设。传统上被认同的、想要推翻或者验证的结论作为原假设。 备择假设:与原假设对立的假设,也称研究假设或者对立假设,是研究者想要收集数据予以支持的假设(一般把研究者的研究内容作为备择假设)。
原假设与备择假设构成完备事件组,且相互对立。 假设检验是寻找证伪证据,两个假设的地位是不等的。一般来说会把待研究的假设设为备择假设,因为原假设一旦被证伪,也意味着被接受的备择假设被否定的概率是很小的。
显著性水平
原假设为真时,拒绝原假设的概率叫检验的显著性水平,通常用alpha 表示。
两类错误
假设检验过程中的两类错误:
- 第Ⅰ类错误(alpha 错误):又叫弃真错误,原假设成立的情况下拒绝了原假设
- 第Ⅱ类错误(beta 错误):又叫取伪错误,原假设为假时接受原假设。 一般来说,可以通过增大样本容量n来同时降低两类错误,当n给定时,两类错误呈现出此消彼长的形势。
在假设检验的过程中,一般会选择先控制alpha 错误。
相较于备择假设,原假设往往相对明确一点,一个含义清楚的假设和一个含义模糊的假设,我们更愿意接手前者。正是在这个背景下,我们就更为关心alpha 错误。
单侧检验
实际生活中,我们希望想要进行检验的假设统计量可能带有方向性,这个时候检验统计量一般会有一个我们能够容忍的上限或者下限,这种情况下的检验我们称之为单侧检验。单侧检验问题一般分为两大类:
- 左单侧检验:又叫下限检验,指的是被检验统计量的取值有一个下限,当检验统计量的值低于该下限时,我们拒绝原假设
- 右单侧检验:又叫上限检验,与上限检验刚好相反。 单侧检验与双侧检验最大的不同时它们的拒绝域往往是朝向某一方的,下限检验的拒绝域往往趋向-infty ,故也叫作左单侧检验。 这里对下限检验的拒绝域趋向方向做一个简单的说明,以以下检验为例:
当假设给定后,mu_0是给定的,这个时候想要推翻原假设,我们就希望样本的均值足够小,换言之,当样本均值小到趋近负无穷时,对应的t统计量也要落到拒绝域内,所以这里的拒绝域应该取为 {t<-t_{alpha}(n-1)} 。(这里只做一个简单的猜想,严谨的证明应该对原假设分情况进行讨论)
单个总体均值的假设检验
与正态分布相比,t分布更加扁平,相同概率条件下得到的临界值相对较大,这是sigma 未知要付出的代价。 随着n的增大,t分布逐渐接近z分布,样本量n>30时,t分布与z分布已经非常接近了,具备了用z分布代替t分布的条件。 单个总体比例的假设检验因为总体的方差直接与总体比例相关使得问题的复杂性降低,只需根据样本的容量n进行分类即可,这里不再赘述。
两个总体参数的假设检验
匹配样本的假设检验
在实际检验的过程中还存在一种匹配样本,由于这种样本数据本身的一些特点使得再进行假设检验时与一般的假设检验有所区别。
匹配样本(matched sample)是指一个样本中的数据与另一个样本中的数据相对应。比如,先指定12个工人用第一种方法组装产品,然后再让这12个工人用第二种方法组装产品,这样得到的两种方法组装产品的数据就是匹配数据。匹配样本可以消除由于样本指定的不公平造成的两种方法组装时间上的差异。
注意独立样本与这种匹配样本的区别,是否来自同一组对象。 对于这样的样本数据,如果存在以下特点,在选择检验方式时会有所区别:
- 两个样本的数据量相等记为n
- 观察值的配对差服从正态分布
- 均值之差的标准差往往不知道
对于这样的样本,在进行假设检验时我们会根据n的大小分为以下两种情况:
- 如果n<30,则认为匹配样本为小样本,这种情况下构造的统计量为
,其中overline{d} 为配对样本差的均值。
- nge 30 ,则按照同样的方法构造Z统计量即可.