ISLR_ANOVA

2018-01-02 17:08:37 浏览数 (2)

  • 概述
  • 核心思想
  • 检定统计量F
  • 结论
  • 适用情况
  • Multi comparison

ANOVA不同于之前的z检定,t检定,这里的零假设包含了很多个变量,具体是μ1=μ2=...=μnmu_1=mu_2=...=mu_n。

概述

核心思想

t检定的核心思想是看样本检定值偏离理想值多远,如果足够远那么就不是因为取样误差造成的。 ANOVA的核心思想是:一个样本的variance可以归结于各种各样的factor,如果组间的variance确实比组内的variance大很多,一般3-10就认为大了,那么认为组件是有差异的。

检定统计量F

结论

适用情况

前面的t统计量的使用情况大多是:

  1. independence
  2. size/skew

Multi comparison

通过ANOVA的F检定,可以发现是否存在μi≠μjmu_i neq mu_j。如果存在,那么下一步就是发现i,ji,j。 但是在这个过程中,会遇到错误累计的问题。也就是假设每对的单独t检定的Type I Error是αalpha,那么如果进行k次检定,Type I Error是1−(1−α)k1-(1-alpha)^k,如果kk很大,那这个值也很大。 也就是说,不能根据F检定的Type I Error去给每对在单独做同样Type I Error的t检定,每对t检定的Type I Error应该更小一点。

0 人点赞