“ 什么是假设检验?假设检验能帮我们做什么事情?”
一个优秀的色子被掷出的时候,必然是等概率的出现各个面的,即每个点都有1/6的可能性出现。
如果一个人摸出俩色子,跟你猜大小,你怎知道这俩色子有没有被做过手脚?如果不把色子切开看,怎么能知道这个色子的质地是否均匀分布?是否等概率的出现大小点呢?
假设检验可以帮到我们。
01
—
假设检验
假设检验说起来很简单:
- 我们针对随机的事件,提出一个假设。好比色子大、小点等概率出现。
- 然后对上面的假设进行检验。多掷几次看看和前面假设的结果是否匹配。
百度百科上对假设检验是这么定义的:
假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
上面这段话是依据看上去很正确的废话,因为正常人很难看得懂。假设检验,说的直白点,就是利用“小概率事件"原理。
还是以掷色子为例,好了,我假设你的色子没问题。我扔一下是大,50%的概率,没问题;如果再扔一下还是大,25%,好吧,可能手气太好了;连着又扔了5下,都是大。这就让我很有理由怀疑你的色子是有问题的。
从上面这个例子我们看出来了,我们利用小概率事件在一次实验中几乎不发生这件事来对我们的假设进行证反。
再举一个例子,好比我们假设某个地区的平均身高是1.7米,而一个地区人的身高是服从正态分布的。那么超过两米的人出现的概率是很小的,如果你在这个地区逛街,一个下午就碰到几个超过两米的人,那么你就有充分的理由怀疑你前面关于这个地区平均身高1.7米这个假设太低了。
02
—
P值
如果我们只是像前面那样凭感觉来做事,那就太不数学了。我们需要一个数值的东西和一些数学公式来精准的指导我们做假设检验这件事。P值这个概念就可以胜任这个事。
P值说的是什么呢?还是以掷色子为例,我们假设出现大、小点的概率是等同的。那么我们来掷10次色子,这10次投递出现8次大的概率P8、出现9次大的概率P9,出现10次大的概率P10,我们把这三个概率给加起来得到的一个值,我就叫P值。如果这个P值很小,但是它这个事件却真实发生了,我们就有理由怀疑前面的假设是错误的。
当然你也可以拿9次、10次大的概率相加得到一个P-value。
P值不一样,我们推翻前面假设的信心也不一样。P值越小的事件发生,我们推翻假设的信心越强。
- 如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
- 如果0.01<P值<0.05,说明较弱的判定结果,拒绝假定的参数取值。
- 如果P值>0.05,说明结果更倾向于接受假定的参数取值。