生存曲线基础篇：这两个问题要清楚，避免踩雷！

生存分析系列至今，已进入终章。

每个人对统计学都存在着爱与恨，0.05这个数字像是莫得感情的虚拟法官，时刻对我们所做的工作进行宣判。

统计太重要了，它能够对我们观察到的某种现象进行数据上的整理，而不是仅仅停留在描述性观点上。

但是生命科学研究又不是冷冰冰的数据分析，我们要在微妙的变化中发现现象，进而开展深入研究。

“ 生命科学研究中，我们该如何把握统计与实验结果的关系呢？”

答案：使用正确的统计学方法。

统计分析就像走钢丝一样，稍有不慎，就会选错方法，轻则错失研究中的微妙变化，重则得出错误结论。

同样，生存分析中最常用的Kaplan-Meier法也存在这种需要谨慎选择的时候。两组之间生存率差异分析该看哪个？

医学统计学第4版上说过，对多组间的生存分析本质上属于非参数统计方法。因此，就存在2个雷区。大家可要看好了。

雷区1：↓

多组间数据的比较不可以单纯地使用两两比较来代替，而必须考虑整个数据集合。

例如存在A、B、C、D四组数据需要做生存分析，比较生存率差异。

如果，你仅需分别比较B、C、D三组数据与A组的差异，不涉及B、C、D三组之间的比较，此时假设检验分别是A=B（检验水平为0.05）、A=C（检验水平为0.05）、A=D（检验水平为0.05），然后单独做两两比较（AB、AC、AD），若P值＜0.05，则代表被检验的两组之间存在差异，谁大谁小就需单独查看AB、AC、AD的生存曲线。

如果需要分析A、B、C、D四组之间任意两组的差异，必须将A、B、C、D四组的数据作为一个数据集合来分析，即假设A=B=C=D，检验水平为0.05。此时的假设是各组之间生存率相同，就算P值小于0.05，也仅仅只能代表A、B、C、D四组之间生存率不完全相同，具体怎么个不同法，是不清楚的。接下来绝对不能只看两两比较（AB、AC、AD、BC、BD、CD）的P值是否＜0.05，而是要进行检验水平校正（Bonferroni校正），校正方法是0.05除以K值[ K=n ×（n-1）/2 ，n为组别数]。然后看两两比较的P值是否小于K值，小于K值就代表两组之间存在差异。

雷区2：

Kaplan-Meier法是最常用的生存分析法，其下存在log-rank和Breslow两种检验。尽管都属于Kaplan-Meier法，但是千万不可混用，它们有着本质的区别。

① log-rank检验是比较生存分布的等同性的检验。在此检验中，所有时间点均赋予相同的权重。

解读：例如分析A、B、C、D四组之间生存率差异，A组死亡多发生在早期，B组多发生于中期，C、D两组多发生在后期。log-rank检验时不考虑研究时单位时间点的区别，所有时间点都默认权重相同。因此，log-rank检验更适合对远期生存率的评估。

② Breslow检验是比较生存分布的等同性的检验。在每个时间点用带风险的个案数对时间点加权。

解读：还是上面的例子，分析A、B、C、D四组之间生存率差异，A组死亡多发生在早期，B组多发生于中期，C、D两组多发生在后期。Breslow检验时认为单位时间点是存在区别的，并采用该时间点上的死亡例数对该时间点进行加权。因此，Breslow检验更加适合对短期试验生存率的评估。

以上是两个重要的雷区，内容比较枯燥，但是又很重要。

至此，生存分析系列就结束了。聊点学术公众号的内容终于补上了这一关键内容。

Ending

rank

0 人点赞