前几天,一位好友投稿前让我帮看一下他的稿件,发现他对两个统计方法的概念未厘清。细聊之下,感觉这两个问题很多人未曾重视。
今天,借此推文,详细说明。
1
—
如何理解单因素方差分析?
单因素方差分析是大家都非常熟悉的一种检验方式,可以进行多组间数据比较。自然而然,很多人都清楚使用此方法的前提是每组数据均正态分布、组间方差齐,然后才能进行检验。
但是,注意了。
很多人都忽略了单因素这个重要前提。单因素的意思是在本次统计中有且只有一个控制变量(不同水平)存在,其他资料同质。如果忽略这个问题,那么在统计分析和标注统计结果时会犯下2个错误。以下详细说明。
例如,我们要分析X药对心梗大鼠心脏射血分数的改善作用。(造模方法看这里→什么?2分钟完成心梗模型,还不需要呼吸机?)。一般性的分组方式为假手术组、模型组、X药高剂量组、X药中剂量组、X药低剂量组和阳性对照药组,治疗结束后检测各组大鼠的射血分数。
假若各组数据均正态,方差齐。一般,大家会立刻开始进行单因素方差分析,有些人可能会建立如下表格(数据仅做说明使用,不代表真实情况)。
组别 | 射血分数(%) |
---|---|
假手术组 | 90.70±3.03 |
模型组 | 57.13±13.53* |
X药高剂量组 | 72.74±9.99*# |
X药中剂量组 | 68.04±3.11*# |
X药低剂量组 | 64.42±3.33*# |
阳性对照药组 | 78.16±9.95*# |
(注:与假手术组相比,*P<0.01;与模型组比较,#P<0.05。)
这样的表格存在2个问题。原因如下:
第1个问题。既然采用单因素方差分析,那么被比较的组之间必定只有一个不同的因素存在。
假手术组、模型组之间只有1个不同因素,即是否造模。
模型组、药物治疗组之间只有1个不同因素,即是否治疗。
假手术组和药物治疗组之间存在2个不同因素,即造模和治疗。采用单因素方差比较假手术组和药物治疗组之间的差异是不正确的,更不该标注。
第2个问题。我们评价药物疗效的前提是判断模型是否成功建立,此时应该首先采用两个独立样本t检验比较假手术组和模型组,判定模型成功之后,再使用单因素方差检验模型组、X药组、阳性药组的数据差异。
有人可能会问,阳性药和X药组之间能够用单因素方差结果比较吗?
这个问题是值得思考的。研究X药是为了看该药在靶点或靶器官上发挥的作用,阳性药是一种确定对你关注的靶点或靶器官有治疗作用的药物。若比较两者,此时可将阳性药、X药均看成对该靶点的治疗药物,只是它们的作用强度不同(同理,模型组可看做是对该靶点或靶器官作用为0的药物组)。简言之,就是观察心梗造模后,不同作用强度的药物对该靶点或靶器官的治疗差异。
因此可以使用单因素方差结果比较阳性药和X药之间的治疗差异。
2
—
如何理解多组间非参数检验?
第二部分的正文内容从这里开始。
若各组的数据存在非正态分布,或组间方差不齐,则必须选择多组间非参数检验,进行组间两两比较。
自SPSS版本升级到20之后,增加了多组间非参数检验这个模块。多组件非参数检验
操作方法:
1. 打开SPSS,数据录入后,点击如下。
2. 在弹出的对话框中选择“字段”,将检验指标放入“检验字段”,组别放入“组”,点击运行,输出如下对话框。若存在组间差异,则会标记为黄色;若无组间差异,则无黄色标记。
3. 双击该选框后,可在模型查看器中显示详细结果,在右下方独立视图处选择“成对比较”。
4. 统计结果如下。
针对多组间非参数检验,说3个问题。
第1个问题。在结果列表中,一定要看调整后显著性这一列的数据,即图中标黄数据。前面一列的显著性结果是无意义的。
为什么呢?
非参数检验也称为“秩和检验”,即将所有组的所有数据按照大小排序,数据的序号代表了该数据在本次非参数检验中的意义。
因此,一旦确定了组别数和各组的数据个数,那么它们的大小排序就确定了。大家可以想象一下,两个组的数据按大小排序后某数据的序列号,与四个组的所有数据按大小排序后该数据的序列号显然不同。前者为结果列表中“显著性”,后者为结果列表中“调整后显著性”。
第2个问题。选择了多组间非参数检验,结果一定要以“箱式图”呈现(如下)。
采用三线表,均值±标准的方式呈现数据是不可以的,在上面标注非参数检验的统计结果更是不正确。SCI中有很多数据的结果都是以箱式图呈现的,国内文章很少见到,箱式图似乎“水土不服”。
最后再说一点,多组间非参数检验的检验效能很强,难以出现统计学差异。唯一的办法就是在实验设计时扩大样本量,不入此门。
The End