多指标联合诊断的ROC曲线

2023-02-14 17:26:09 浏览数 (1)

关于ROC曲线,前前后后写了很多篇推文,关于二分类数据和生存资料的都有,目前只有多指标联合诊断的ROC曲线还没介绍了,今天就介绍多指标联合诊断的ROC曲线

  • 多时间点和多指标的ROC曲线
  • 临床预测模型之二分类资料ROC曲线的绘制
  • 临床预测模型之生存资料ROC曲线的绘制
  • ROC曲线(AUC)的显著性检验
  • 生存资料ROC曲线的最佳截点和平滑曲线
  • ROC曲线纯手工绘制
  • R语言计算AUC(ROC曲线)的注意事项
  • ROC阴性结果还是阳性结果

准备数据

代码语言:javascript复制
library(pROC)

data(aSAH)
str(aSAH)
## 'data.frame': 113 obs. of  7 variables:
##  $ gos6   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 5 5 5 5 1 1 4 1 5 4 ...
##  $ outcome: Factor w/ 2 levels "Good","Poor": 1 1 1 1 2 2 1 2 1 1 ...
##  $ gender : Factor w/ 2 levels "Male","Female": 2 2 2 2 2 1 1 1 2 2 ...
##  $ age    : int  42 37 42 27 42 48 57 41 49 75 ...
##  $ wfns   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 1 1 1 1 3 2 5 4 1 2 ...
##  $ s100b  : num  0.13 0.14 0.1 0.04 0.13 0.1 0.47 0.16 0.18 0.1 ...
##  $ ndka   : num  3.01 8.54 8.09 10.42 17.4 ...

其中outcome是结果变量,是二分类的,其余列是预测变量。

多指标联合诊断的ROC

假如现在我想使用s100b/ndka/age这3个变量来预测结果,该如何画出这3个变量联合诊断的ROC曲线呢?

首先,使用这3个变量建立逻辑回归:

代码语言:javascript复制
f <- glm(outcome ~ s100b   ndka   age, data = aSAH, family = binomial())

然后,计算逻辑回归给出的概率:

代码语言:javascript复制
# 等价于直接使用 f$fitted
pred <- predict(f, newdata = aSAH, type = "response")

aSAH$pred <- pred

用这个pred就可以画ROC曲线了,这个就是多指标联合诊断的ROC曲线。

代码语言:javascript复制
library(yardstick)

roc_curve(aSAH, truth = outcome, estimate=pred,event_level = "second") |> 
  autoplot()

测试集怎么办?

很简单,只要把predict中的数据集换成测试集即可:

代码语言:javascript复制
# 换成测试集即可
pred <- predict(f, newdata = 你的测试集, type = "response")

剩下的就都一样了!


0 人点赞