吴恩达团队新研究：用X光片识别14种疾病，AI准确度部分超越人类

栗子射线发自凹非寺量子位报道 | 公众号 QbitAI

最近，吴恩达的斯坦福团队发布了一个X光诊断算法，基于深度神经网络。

与曾经的肺炎检测专门算法不同，这次的CheXNeXt模型，可以诊断14种疾病，包括肺炎、胸腔积液、肺肿块等等。

在其中10种疾病的诊断上，AI都与人类放射科医生的表现相当，还有一种超过了人类。并且，AI的诊断速度是人类的160倍。

团队说，这样的算法有希望填补医疗资源的短缺，也可以用来减少人类医生因为疲劳而导致的诊断错误。

AI医生如何炼成

最大的数据集

算法是用ChestX-ray14数据集来训练的，这是目前最大的X光数据库，有超过11万张正面胸片，来自3万多位患者。

14，就代表这些胸片里，总共包含了14种肺部疾病。

每一张胸片都要标注，是根据医生的放射学报告，用自动提取 (Automatic Extaction) 的方法来标注的。

训练过程分两步

算法是由多个神经网络集合而成。

第一步，由于是自动标注，所以要解决标签部分不正确 (Partially Incorrect) 的问题。

具体方法是，先让这些神经网络，在数据集里训练14种疾病的预测。然后用它们做出的预测，来重新标注数据集。

第二步，再拿一个新的神经网络集合，在新标注的数据集上训练。这次训练完成，AI就可以去诊断疾病了。

那么，AI预测过程中的重点在哪里？

图上有重点

算法不需要任何额外的监督，就可以用胸片来生成热图 (Heat Map) ，相当于划重点：

颜色越暖的部分，对疾病诊断越有价值。

这是依靠类激活图 (Class Activation Mapping，CAM) 来完成的。

如此一来，AI就像人类一样，知道诊断某种疾病的时候，哪里才是该重点关注的部分。

人机大赛

训练好之后，团队找了9个人类放射科医生来比赛。其中：

6位来自学术机构，平均经验超过12年。

3位来自医院，是放射科高级住院医师。

人类和AI要识别的，是420张正面胸片，也是包含14种疾病：

肺不张，心脏肥大，巩固，水肿，积液，肺气肿，纤维化，疝气，浸润，肿块，结节，胸膜增厚，肺炎，气胸。

比赛结果如下：

只有在心脏肥大，肺气肿和疝气这三项诊断中，AI明显不敌人类选手的准确度。

在肺不张的诊断中，AI的表现明显优于人类。

△ 正常心脏 (左) vs 肥大心脏 (右)

其他10项，人类与AI不相上下。

总体来说，算法的诊断能力与与放射科医生相近。

所以，还是看一下速度吧。

420张图，AI用时1.5分钟，人类用时240分钟。

吴恩达老师常年追求的“AI颠覆医疗”之说，还是在时间上体现最显著。

One More Thing

随研究成果一同发布的视频里，有一个叫XRay4All的手机应用，只要给胸片拍个照，就可以让AI帮忙诊断了。

不知那会是多远的未来，但这次的人机较量，AI的表现还是能看到希望的。

论文传送门： https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1002686

— 完 —

编程算法神经网络医疗数据库

0 人点赞