吴恩达团队新研究:用X光片识别14种疾病,AI准确度部分超越人类

2018-12-18 17:10:05 浏览数 (1)

栗子射线 发自 凹非寺 量子位 报道 | 公众号 QbitAI

最近,吴恩达的斯坦福团队发布了一个X光诊断算法,基于深度神经网络。

与曾经的肺炎检测专门算法不同,这次的CheXNeXt模型,可以诊断14种疾病,包括肺炎、胸腔积液、肺肿块等等。

在其中10种疾病的诊断上,AI都与人类放射科医生的表现相当,还有一种超过了人类。并且,AI的诊断速度是人类的160倍

团队说,这样的算法有希望填补医疗资源的短缺,也可以用来减少人类医生因为疲劳而导致的诊断错误。

AI医生如何炼成

最大的数据集

算法是用ChestX-ray14数据集来训练的,这是目前最大的X光数据库,有超过11万张正面胸片,来自3万多位患者。

14,就代表这些胸片里,总共包含了14种肺部疾病。

每一张胸片都要标注,是根据医生的放射学报告,用自动提取 (Automatic Extaction) 的方法来标注的。

训练过程分两步

算法是由多个神经网络集合而成。

第一步,由于是自动标注,所以要解决标签部分不正确 (Partially Incorrect) 的问题。

具体方法是,先让这些神经网络,在数据集里训练14种疾病的预测。然后用它们做出的预测,来重新标注数据集

第二步,再拿一个新的神经网络集合,在新标注的数据集上训练。这次训练完成,AI就可以去诊断疾病了。

那么,AI预测过程中的重点在哪里?

图上有重点

算法不需要任何额外的监督,就可以用胸片来生成热图 (Heat Map) ,相当于划重点

颜色越暖的部分,对疾病诊断越有价值。

这是依靠类激活图 (Class Activation Mapping,CAM) 来完成的。

如此一来,AI就像人类一样,知道诊断某种疾病的时候,哪里才是该重点关注的部分。

人机大赛

训练好之后,团队找了9个人类放射科医生来比赛。其中:

6位来自学术机构,平均经验超过12年。

3位来自医院,是放射科高级住院医师。

人类和AI要识别的,是420张正面胸片,也是包含14种疾病:

肺不张,心脏肥大,巩固,水肿,积液,肺气肿,纤维化,疝气,浸润,肿块,结节,胸膜增厚,肺炎,气胸。

比赛结果如下:

只有在心脏肥大,肺气肿和疝气这三项诊断中,AI明显不敌人类选手的准确度。

在肺不张的诊断中,AI的表现明显优于人类

正常心脏 (左) vs 肥大心脏 (右)

其他10项,人类与AI不相上下

总体来说,算法的诊断能力与与放射科医生相近。

所以,还是看一下速度吧。

420张图,AI用时1.5分钟,人类用时240分钟。

吴恩达老师常年追求的“AI颠覆医疗”之说,还是在时间上体现最显著。

One More Thing

随研究成果一同发布的视频里,有一个叫XRay4All的手机应用,只要给胸片拍个照,就可以让AI帮忙诊断了。

不知那会是多远的未来,但这次的人机较量,AI的表现还是能看到希望的。

论文传送门: https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1002686

0 人点赞