生存分析系列至今,已进入终章。
每个人对统计学都存在着爱与恨,0.05这个数字像是莫得感情的虚拟法官,时刻对我们所做的工作进行宣判。
统计太重要了,它能够对我们观察到的某种现象进行数据上的整理,而不是仅仅停留在描述性观点上。
但是生命科学研究又不是冷冰冰的数据分析,我们要在微妙的变化中发现现象,进而开展深入研究。
“ 生命科学研究中,我们该如何把握统计与实验结果的关系呢?”
答案:使用正确的统计学方法。
统计分析就像走钢丝一样,稍有不慎,就会选错方法,轻则错失研究中的微妙变化,重则得出错误结论。
同样,生存分析中最常用的Kaplan-Meier法也存在这种需要谨慎选择的时候。两组之间生存率差异分析该看哪个?
医学统计学第4版上说过,对多组间的生存分析本质上属于非参数统计方法。因此,就存在2个雷区。大家可要看好了。
雷区1:↓
多组间数据的比较不可以单纯地使用两两比较来代替,而必须考虑整个数据集合。
例如存在A、B、C、D四组数据需要做生存分析,比较生存率差异。
如果,你仅需分别比较B、C、D三组数据与A组的差异,不涉及B、C、D三组之间的比较,此时假设检验分别是A=B(检验水平为0.05)、A=C(检验水平为0.05)、A=D(检验水平为0.05),然后单独做两两比较(AB、AC、AD),若P值<0.05,则代表被检验的两组之间存在差异,谁大谁小就需单独查看AB、AC、AD的生存曲线。
如果需要分析A、B、C、D四组之间任意两组的差异,必须将A、B、C、D四组的数据作为一个数据集合来分析,即假设A=B=C=D,检验水平为0.05。此时的假设是各组之间生存率相同,就算P值小于0.05,也仅仅只能代表A、B、C、D四组之间生存率不完全相同,具体怎么个不同法,是不清楚的。接下来绝对不能只看两两比较(AB、AC、AD、BC、BD、CD)的P值是否<0.05,而是要进行检验水平校正(Bonferroni校正),校正方法是0.05除以K值[ K=n ×(n-1)/2 ,n为组别数]。然后看两两比较的P值是否小于K值,小于K值就代表两组之间存在差异。
雷区2:
Kaplan-Meier法是最常用的生存分析法,其下存在log-rank和Breslow两种检验。尽管都属于Kaplan-Meier法,但是千万不可混用,它们有着本质的区别。
① log-rank检验是比较生存分布的等同性的检验。在此检验中,所有时间点均赋予相同的权重。
解读:例如分析A、B、C、D四组之间生存率差异,A组死亡多发生在早期,B组多发生于中期,C、D两组多发生在后期。log-rank检验时不考虑研究时单位时间点的区别,所有时间点都默认权重相同。因此,log-rank检验更适合对远期生存率的评估。
② Breslow检验是比较生存分布的等同性的检验。在每个时间点用带风险的个案数对时间点加权。
解读:还是上面的例子,分析A、B、C、D四组之间生存率差异,A组死亡多发生在早期,B组多发生于中期,C、D两组多发生在后期。Breslow检验时认为单位时间点是存在区别的,并采用该时间点上的死亡例数对该时间点进行加权。因此,Breslow检验更加适合对短期试验生存率的评估。
以上是两个重要的雷区,内容比较枯燥,但是又很重要。
至此,生存分析系列就结束了。聊点学术公众号的内容终于补上了这一关键内容。
Ending