「R」R 语言中的功效分析

2020-07-02 21:50:33 浏览数 (2)

功效分析是统计检验中很重要的一部分,但实际上在科学文献中,特别是生命科学研究中极少有人使用。一方面是实验条件有限,另一方面是分析水平有限。希望有条件的实验人员在进行分析时还是应当考虑下功效。

功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值所需的样本量。反过来,它也可以帮助你在给定置信度水平情况下,计算在某个样本量内能检测到给定效应值的概率。如果概率低得难以接受,修改或放弃这个实验将是一个明智的选择。

在研究过程时,研究者通常关注四个量:样本大小、显著性水平、功效和效应值。

  • 样本大小指实验设计中每种条件中观测的数目。
  • 显著性水平(也称为alpha)由I型错误的概率来定义。也可以把它看作发现效应不发生的概率。
  • 功效通过1减去II型错误的概率来定义。可以把它看作真实效应发生的概率。
  • 效应值指的是在备择或研究假设下效应的值。效应值的表达值依赖于假设检验中使用的统计方法。

四个量紧密相关,给定其中任意三个量,便可以推算第四个量。

用 pwr 包做功效分析

下面中列出了一些非常重要的函数,对于每个函数,用户可以设定四个量(样本大小、显著性水平、功效和效应值)中的三个值,第四个量将由软件计算出来。

函数

功效计算的对象

pwr.2p.test()

两比例(n相等)

pwr.2p2n.test()

两比例(n不相等)

pwr.anova.test()

平衡的单因素ANOVA

pwr.chisq.test()

卡方检验

pwr.f2.test()

广义线性模型

pwr.p.test()

比例(单样本)

pwr.r.test()

相关系数

pwr.t.test()

t检验(单样本、两样本、配对)

pwr.t2n.test()

t检验(n不相等的两样本)

在使用这些函数之前,请仔细阅读相关文档,设定相应的参数。不同分布中,差异主要表现在效应值的定义上。

我曾经看到一篇关于 t 检验效应值理解和计算的推文,我把它转载到了另一篇文章,请看《找出t检验的效应大小,对耍流氓 say no!》,该文章可以作为一个实例阅读,分析函数的使用可以用它作为参考。

其他软件包

软件包

目的

asypow

通过渐进似然比方法计算功效

longpower

纵向数据中样本量的计算

PwrGSD

组序列设计的功效分析

pamm

混合模型中随机效应的功效分析

powerSurvEpi

流行病研究的生存分析中功效和样本量的计算

powerMediation

线性、Logistic、泊松和Cox回归的中介效应中功效和样本量的计算

powerpkg

患病同胞配对法和TDT(传送不均衡检验)设计的功效分析

powerGWASinteraction

GWAS交互作用的功效计算

pedantics

一些有助于种群基因研究功效分析的函数

gap

一些病例队列研究设计中计算功效和样本量的函数

ssize.fdr

微阵列实验中样本量的计算

0 人点赞