关于ROC曲线,前前后后写了很多篇推文,关于二分类数据和生存资料的都有,目前只有多指标联合诊断的ROC曲线还没介绍了,今天就介绍多指标联合诊断的ROC曲线。
- 多时间点和多指标的ROC曲线
- 临床预测模型之二分类资料ROC曲线的绘制
- 临床预测模型之生存资料ROC曲线的绘制
- ROC曲线(AUC)的显著性检验
- 生存资料ROC曲线的最佳截点和平滑曲线
- ROC曲线纯手工绘制
- R语言计算AUC(ROC曲线)的注意事项
- ROC阴性结果还是阳性结果
准备数据
代码语言:javascript复制library(pROC)
data(aSAH)
str(aSAH)
## 'data.frame': 113 obs. of 7 variables:
## $ gos6 : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 5 5 5 5 1 1 4 1 5 4 ...
## $ outcome: Factor w/ 2 levels "Good","Poor": 1 1 1 1 2 2 1 2 1 1 ...
## $ gender : Factor w/ 2 levels "Male","Female": 2 2 2 2 2 1 1 1 2 2 ...
## $ age : int 42 37 42 27 42 48 57 41 49 75 ...
## $ wfns : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 1 1 1 1 3 2 5 4 1 2 ...
## $ s100b : num 0.13 0.14 0.1 0.04 0.13 0.1 0.47 0.16 0.18 0.1 ...
## $ ndka : num 3.01 8.54 8.09 10.42 17.4 ...
其中outcome
是结果变量,是二分类的,其余列是预测变量。
多指标联合诊断的ROC
假如现在我想使用s100b/ndka/age
这3个变量来预测结果,该如何画出这3个变量联合诊断的ROC曲线呢?
首先,使用这3个变量建立逻辑回归:
代码语言:javascript复制f <- glm(outcome ~ s100b ndka age, data = aSAH, family = binomial())
然后,计算逻辑回归给出的概率:
代码语言:javascript复制# 等价于直接使用 f$fitted
pred <- predict(f, newdata = aSAH, type = "response")
aSAH$pred <- pred
用这个pred
就可以画ROC曲线了,这个就是多指标联合诊断的ROC曲线。
library(yardstick)
roc_curve(aSAH, truth = outcome, estimate=pred,event_level = "second") |>
autoplot()
测试集怎么办?
很简单,只要把predict
中的数据集换成测试集即可:
# 换成测试集即可
pred <- predict(f, newdata = 你的测试集, type = "response")
剩下的就都一样了!