【文献精读】基于随机森林的房颤预测模型6分文章

2019-10-31 12:53:56 浏览数 (1)

本文转载自友好合作伙伴医科研,作者白介素2,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO,SEER数据挖掘。

.

作者:白介素2

今天是周末,终于腾出一点时间来看看文献,分享给大家。文章题为:A novel atrial fibrillation prediction model for Chinese subjects: a nationwide cohort investigation of 682 237 study participants with randomforest model,文章发表在 Oxford旗下EP Europace杂志,影响因子为6.1分.

image.png

摘要

image.png

文章主要研究内容是开发了一个针对华人的房颤预测模型,使用的数据量达到682237例,按9:1分为训练集,测试集。使用了 F1 值recall values, ROC , K-fold交叉验证等方法来评估模型的性能。

结果展示

研究的人口学特征展示

image.png

第一张结果,展示研究人群的基线数据。

效果评估

image.png

计算了评估指标在各个数据集中的值。

与其它模型比较

image.png

比较了现开发的基于 Random Forest模型与其它模型的 ROC比较,显然 RF表现出了明显的优越性。

讨论

我个人比较喜欢看着一部分的内容。

主要创新点

[图片上传失败…(image-eff977-1571562023964)]

作者说:其实在这个模型之前已经有其它针对房颤的模型了,然而其它模型都是基于西方人口队列的。而本研究是基于中国人群的模型构建,这样的模型才会更适用于中国人。

文章不足

image.png

这一部分很多文章可能就是一句套话,说这个研究是一个回顾性的分析就完了,看看人家作者怎么写的。

  • 不可避免的混杂因素,叫做 cofounding factors
  • 缺少生活方式等数据作为预测因子
  • 本文是基于回顾性分析 retrospective nature of this study
  • 本文是用于预测临床诊断的房颤,而实际上会低估房颤的发生率,因为有些仅仅有症状,或通过心电图才能发现
  • 由于数据的保密性,没能比较对勾预测模型的性能,看哪个是最好的。
  • 创新点同样也是缺陷,因为数据是对华人的,那应用也只能针对华人

参考文献

A novel atrial fibrillation prediction model for Chinese subjects: a nationwide cohort investigation of 682 237 study participants with random forest model , 2019 下载地址

今天的文献解读就到这里,我是白介素2,下期再见。

0 人点赞