一文解决列线图(nomogram)

2019-08-12 16:49:09 浏览数 (1)

介绍

列线图,又称诺莫图(Nomogram),它是建立在多因素回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概率。

在wikipedia 里对Nomogram的介绍是,Nomogram—词来源于希腊语,Nomos指“法律”而Gramma意思是“书写”。Nomogram的理论是由法国工程师 Philbert Maurice d’Ocagne (1862-1938) 于1884年提出,最早用于工程学,它能够将复杂的工程力学等计算公式以图形的方式,快速、直观、精确的展现出来。换句话说,绘制Nomogram旨在以绘图的方法来阐述不同变量之间的关系。在医学领域,Nomogram优势在于可个性化的计算特定肿瘤患者生存率, 因此在临床实践中有很大的价值。

基本原理

通过构建多因素回归模型(常用的回归模型,例如Cox回归、Logistic回归等),根据模型中各个影响因素对结局变量的影响程度的高低 (回归系数的大小),给每个影响因素的每个取值水平进行赋分,然后再将各个评分相加得到总评分,最后通过总评分与结局事件发生概率之间的函数转换关系,从而计算出该个体结局事件的预测概率。

优势

列线图将复杂的回归方程,转变为了简单且可视化的图形,使预测模型的结果更具有可读性,具有更高的使用价值。而这种优点使得列线图在医学研究和临床实践中得到了更多的关注和应用。

图形示范

我们用个例子来说明Nomogram的用法,我们用两个临床指标来预测某疾病的发病率,其中Age是连续性变量,Sex为二分类变量;age的取值范围在35-85之间,sex的取值为female或者male,具体绘制出的Nomogram图形如下:

从上图可以看出nomogram的构成分为三类:

  1. 用于预测模型的变量:例如图中的age,sex,每一个变量对应的线段上都标注了刻度,代表了该变量的可取值范围,而线段的长度则反映了该因素对结局事件的贡献大小。
  2. 变量相应的得分,即图中最上方的Points,表示每个变量在不同取值下所对应的得分,所有变量取值后对应的单项分数加起来合计的总得分即Total Points。
  3. 预测事件的发生概率:例如图中最下方的risk,代表肿瘤发生的概率。

列线图的效果评价

在绘制列线图后也需要对模型的预测能力进行评价。常用的效果评价方式有:

  1. 内部验证法

可采用Bootstrap自抽样法,利用建模自身的数据来验证模型的预测效果。Bootstrap自抽样法是指对样本人群进行有放回的重复抽样,每次抽样样本数相同,这样同一个个体就有可能被抽中多次。利用Bootstrap自抽样产生的新样本去评价列线图模型的准确性,常用C-统计量来进行衡量,其值越接近于1说明列线图的预测能力越准确。

  1. 图形校准法

图形校准法的基本思想是:首先利用列线图预测出每位研究对象的生存概率,并从低到高排成一个队列,根据四分位数将队列分为4组(或者根据其他分位数分组),然后分别计算每组研究对象预测生存概率和相应的实际生存概率(由Kaplan-Meier法计算)的均值,并将两者结合起来作图得到4个校准点,最后将4个校准点连接起来得到预测校准曲线。

理论上标准曲线是一条通过坐标轴原点、且斜率为1的直线,如果预测校准曲线越贴近标准曲线,则说明列线图的预测能力越好。

  1. 外部验证法

使用一组研究对象去建立列线图,再使用另外一组研究对象(即外部数据)来验证列线图预测效果的准确性。

0 人点赞