新冠肺炎“识别”战，AI算法落地有多难？

作者 | 蒋宝尚

编辑 | 贾伟

人工智能从来没有像现在这么重要过！

这段时间的疫情猛烈，AI每一次在医疗领域的落地都在帮助白衣天使拯救生命。从疫情预测到检测体温再到药物开发，人工智能争分夺秒，蓄势待发。

更为准确的说是医疗AI公司们站了出来，为医护人员铸造了一面坚强的后盾。

1月28日，依图医疗的第一版新冠肺炎产品在上海公卫上线，2月5日在武汉的协和医院、中南医院、武汉大学人民医院以及荆州市第一人民医院完成部署。 1月31日，推想科技宣布推出针对新冠肺炎筛查产品。 2月15日，阿里巴巴宣布：达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新AI诊断技术，AI可以在20秒内准确地对新冠疑似案例CT影像做出判读，分析结果准确率达到96%。 .... ...

相对于巡逻机器人的检测体温，CT影像的自动检测才能代表AI在医疗领域的最高水准，但也更难大规模应用，这里面不仅包含算法难关，更存在着不断迭代的需求。

但此技术又不得不加紧落地！因为在2月5日，国家卫健委发文表示：在湖北省内，CT影像结果要作为新型冠状病毒感染“临床诊断病例”的判定依据。

那么AI技术在从算法到应用层面有哪些难点呢？

具体算法，遍地开花

在2017年春节期间，斯坦福大学工程学院和医学院合作团队在《自然》上发布了在皮肤癌诊断领域的最新突破。他们在谷歌用于识别猫和狗算法的基础上，经过13万张皮肤病变的图像训练后，开发出了可用于识别皮肤癌的AI系统。

吴恩达教授也在2017年发表相关研究，其使用CheXNet算法训练的模型可以诊断14种病症，尤其在肺炎诊断方面，比放射科专家单独诊断的准确率更高。

2018年Google的Gulshan团队采用近13万张已由54位美国专家标注过的视网膜眼底图像，对深度学习网络进行训练，检测准确率达到曲线下面积91%。

同年，国家千人计划“入选者张康教授率领中国研究团队在顶级期刊《细胞》上发表了一篇AI在医疗领域应用，即基于深度学习开发出一个能诊断眼病和肺炎两大类疾病的AI系统，就准确性来说能够匹敌顶尖医生。

值得一提的是，张康教授的那项研究也是世界范围内首次使用庞大的标注好的高质量数据进行迁移学习。

迁移学习可以解决训练数据不足的局限。

那么这么多突破性的研究，这么多表现良好的算法模型为什么却在实际应用效果不佳呢。

首先在胸片上发现肺炎非常困难，即使对放射科医师来说，他们眼中的胸透图像的肺炎特征也是模糊的，容易和许多其他的良性异常相混淆。

也就是说人工智能系统对肺部CT影像的片状阴影不够敏感，而片状阴影是新型冠状病毒肺炎的主要病灶。

而要想要鉴别新冠肺炎影像与普通病毒性肺炎影像也并不容易，临床上影像科的医生有自己的判别标准，拥有这个标准的开发人员会尝试不同的方法提升自己的模型，但是一些算法的训练研究员并不具有放射科的背景，另外这个标准也并不是容易量化。

对于训练数据来说，数据量的多少不是关键，关键的是有代表性的以及疑难的数据有多少，一个基于学习而不是规则的算法本身需要大量的类似数据才能学习到正确的知识。在AI在检测新冠状肺炎肺炎的时候，由于缺少“疑难杂症”样本数据，即使识别了99%的病人，但是可能真正有威胁的是那没有识别出了1%。

目前深度学习训练过程中所采用的解释性的方法基本都是可视化方法，看哪些部位对患病概率的贡献比较大，而这个概率只根据CT影像获得的。但是医生在具体判断时候，还要结合病史，遗传，生活习惯等等做出推断。

再有，如果疾病发生新的变异或变化，那么原来的算法模型还能使用么？

考虑到实际情况，各地的CT设备并不是非常统一，也就是说对原算法模型的验证效果很难都达标，甚至可能非常低。即使在原模型基础上进行微调，也可能需要某个型号的CT设备提供的非常多的数据。各地的检测环境也不是非常统一，最差的情况可能会需要对每一台机器进行微调来保证准确率，但这样特殊的数据真的很好采集吗？

参考来源：

https://www.zhihu.com/question/372335557

https://mp.weixin.qq.com/s/Q0H0s1aL8V06p7o2rlf2MQ

编程算法医疗深度学习神经网络人工智能

0 人点赞