功效分析是统计检验中很重要的一部分,但实际上在科学文献中,特别是生命科学研究中极少有人使用。一方面是实验条件有限,另一方面是分析水平有限。希望有条件的实验人员在进行分析时还是应当考虑下功效。
功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值所需的样本量。反过来,它也可以帮助你在给定置信度水平情况下,计算在某个样本量内能检测到给定效应值的概率。如果概率低得难以接受,修改或放弃这个实验将是一个明智的选择。
在研究过程时,研究者通常关注四个量:样本大小、显著性水平、功效和效应值。
- 样本大小指实验设计中每种条件中观测的数目。
- 显著性水平(也称为alpha)由I型错误的概率来定义。也可以把它看作发现效应不发生的概率。
- 功效通过1减去II型错误的概率来定义。可以把它看作真实效应发生的概率。
- 效应值指的是在备择或研究假设下效应的值。效应值的表达值依赖于假设检验中使用的统计方法。
四个量紧密相关,给定其中任意三个量,便可以推算第四个量。
用 pwr 包做功效分析
下面中列出了一些非常重要的函数,对于每个函数,用户可以设定四个量(样本大小、显著性水平、功效和效应值)中的三个值,第四个量将由软件计算出来。
函数 | 功效计算的对象 |
---|---|
pwr.2p.test() | 两比例(n相等) |
pwr.2p2n.test() | 两比例(n不相等) |
pwr.anova.test() | 平衡的单因素ANOVA |
pwr.chisq.test() | 卡方检验 |
pwr.f2.test() | 广义线性模型 |
pwr.p.test() | 比例(单样本) |
pwr.r.test() | 相关系数 |
pwr.t.test() | t检验(单样本、两样本、配对) |
pwr.t2n.test() | t检验(n不相等的两样本) |
在使用这些函数之前,请仔细阅读相关文档,设定相应的参数。不同分布中,差异主要表现在效应值的定义上。
我曾经看到一篇关于 t 检验效应值理解和计算的推文,我把它转载到了另一篇文章,请看《找出t检验的效应大小,对耍流氓 say no!》,该文章可以作为一个实例阅读,分析函数的使用可以用它作为参考。
其他软件包
软件包 | 目的 |
---|---|
asypow | 通过渐进似然比方法计算功效 |
longpower | 纵向数据中样本量的计算 |
PwrGSD | 组序列设计的功效分析 |
pamm | 混合模型中随机效应的功效分析 |
powerSurvEpi | 流行病研究的生存分析中功效和样本量的计算 |
powerMediation | 线性、Logistic、泊松和Cox回归的中介效应中功效和样本量的计算 |
powerpkg | 患病同胞配对法和TDT(传送不均衡检验)设计的功效分析 |
powerGWASinteraction | GWAS交互作用的功效计算 |
pedantics | 一些有助于种群基因研究功效分析的函数 |
gap | 一些病例队列研究设计中计算功效和样本量的函数 |
ssize.fdr | 微阵列实验中样本量的计算 |