两个重要的统计问题。

前几天，一位好友投稿前让我帮看一下他的稿件，发现他对两个统计方法的概念未厘清。细聊之下，感觉这两个问题很多人未曾重视。

今天，借此推文，详细说明。

—

如何理解单因素方差分析？

单因素方差分析是大家都非常熟悉的一种检验方式，可以进行多组间数据比较。自然而然，很多人都清楚使用此方法的前提是每组数据均正态分布、组间方差齐，然后才能进行检验。

但是，注意了。

很多人都忽略了单因素这个重要前提。单因素的意思是在本次统计中有且只有一个控制变量(不同水平)存在，其他资料同质。如果忽略这个问题，那么在统计分析和标注统计结果时会犯下2个错误。以下详细说明。

例如，我们要分析X药对心梗大鼠心脏射血分数的改善作用。(造模方法看这里→什么？2分钟完成心梗模型，还不需要呼吸机？)。一般性的分组方式为假手术组、模型组、X药高剂量组、X药中剂量组、X药低剂量组和阳性对照药组，治疗结束后检测各组大鼠的射血分数。

假若各组数据均正态，方差齐。一般，大家会立刻开始进行单因素方差分析，有些人可能会建立如下表格(数据仅做说明使用，不代表真实情况)。

组别	射血分数(%)
假手术组	90.70±3.03
模型组	57.13±13.53*
X药高剂量组	72.74±9.99*#
X药中剂量组	68.04±3.11*#
X药低剂量组	64.42±3.33*#
阳性对照药组	78.16±9.95*#

(注：与假手术组相比，*P＜0.01；与模型组比较，#P＜0.05。)

这样的表格存在2个问题。原因如下：

第1个问题。既然采用单因素方差分析，那么被比较的组之间必定只有一个不同的因素存在。

假手术组、模型组之间只有1个不同因素，即是否造模。

模型组、药物治疗组之间只有1个不同因素，即是否治疗。

假手术组和药物治疗组之间存在2个不同因素，即造模和治疗。采用单因素方差比较假手术组和药物治疗组之间的差异是不正确的，更不该标注。

第2个问题。我们评价药物疗效的前提是判断模型是否成功建立，此时应该首先采用两个独立样本t检验比较假手术组和模型组，判定模型成功之后，再使用单因素方差检验模型组、X药组、阳性药组的数据差异。

有人可能会问，阳性药和X药组之间能够用单因素方差结果比较吗？

这个问题是值得思考的。研究X药是为了看该药在靶点或靶器官上发挥的作用，阳性药是一种确定对你关注的靶点或靶器官有治疗作用的药物。若比较两者，此时可将阳性药、X药均看成对该靶点的治疗药物，只是它们的作用强度不同(同理，模型组可看做是对该靶点或靶器官作用为0的药物组)。简言之，就是观察心梗造模后，不同作用强度的药物对该靶点或靶器官的治疗差异。

因此可以使用单因素方差结果比较阳性药和X药之间的治疗差异。

—

如何理解多组间非参数检验？

第二部分的正文内容从这里开始。

若各组的数据存在非正态分布，或组间方差不齐，则必须选择多组间非参数检验，进行组间两两比较。

自SPSS版本升级到20之后，增加了多组间非参数检验这个模块。多组件非参数检验

操作方法：

1. 打开SPSS，数据录入后，点击如下。