大数据文摘授权转载自纽约时报
编译:橡树_hiangsug、蒋宝尚
能“看图”识别影像,更能“识字”读懂病例,AI真的学会了这项技能。
2月12日,科研期刊《自然·医学》(Nature Medicine)在线刊发题为《使用人工智能评估和准确诊断儿科疾病》的医疗人工智能成果。
论文链接:
https://www.nature.com/articles/s41591-018-0335-9
根据依图科技官方介绍,该成果由依图医疗联合广州市妇女儿童医疗中心等机构共同研发,基于机器学习的自然语言处理(NLP)技术实现不输人类医生的强大诊断能力,并具备多场景的应用能力。
具体来说,这是一套常见儿童疾病的诊断系统,名为辅诊熊。小至流感大至脑膜炎,这套AI系统都可以通过分析患者的症状、病史、化验结果及其他临床数据对患者的病情进行准确地诊断。
意义重大!
因为,对病人来说,最怕的不是得病而是误诊。毕竟,不能对症下药,就是华佗在世也束手无策。
有数据记载,在全世界,每年都有大量的患者被误诊。
虽然医生们努力通过系统化诊病流程来降低误诊率,但这一方法依旧治标不治本,医生的主观偏差仍然会影响诊断结果。
该系统的准确率很高,且该系统未来有望帮助医生诊断更加复杂罕见的疾病。
大规模数据集加持
总的来说,该系统基于近18万名连续访问儿科医院18个月的中国患者的医疗记录。
“深度学习”是加速革新医疗保健行业的关键技术,数据的数量和质量又是模型建立成败的关键。中国不仅有庞大的人口基数,而且数字信息的使用规范还没有那么严苛,这使得中国科技公司和研究人员更容易获得用于训练“深度学习”的数据集。
特朗普在本周一签署了“美国人工智能倡议”,以促进人工智能在美国政府、学术界和工业界的发展。政令明确指出,政府将鼓励联邦机构和大学共享推动自动化系统发展的数据。
医疗数据的缺乏一直是美国发展人工智能的一道门槛。在中国,研究人员在公立医院相对容易获取足以训练人工智能系统的数据,但同样的事情在美国却没那么容易。
“美国的医生则需要到许多不同的地方(获取数据),” Weill Cornell医学中心临床放射学副教授、MD.ai(为AI研究人员提供数据标注服务)的联合创始人George Shih博士讲道,“而且没有一家医院的检测设备是一样的,我们还必须保证数据是完全匿名的……就算我们获得了原始数据,后续的工作量仍然十分庞大。”
技术关键—神经网络
深度学习在这几年得到了飞速发展,重塑了互联网服务、消费电子产品和无人驾驶汽车,而现在它正大踏步迈进全新的领域——医疗健康。目前,谷歌在内的许多团队正在开发电子健康记录系统,以供诊断骨质疏松症、糖尿病、高血压和心力衰竭等疾症。
类似的技术也被应用于自动检测X光、核磁共振成像和眼部扫描图像呈现出的疾病迹象。
谈及这些新兴系统的本质,其实要归功于神经网络。神经网络是一种人工智能技术,它可通过分析海量数据进行自主学习,输出决策。换言之,神经网络正大举助力各行各业,从医疗保健到无人驾驶汽车,甚至是军事应用领域都有它的一份功绩。
通过这项技术,加州大学圣地亚哥分校眼科遗传学主任张康博士建立了可以分析出血、病变和其他糖尿病失明迹象的眼部扫描系统。理想情况下,这套系统可以为患者建立起第一道防线,而且可以帮助医生对来访者进行初步的筛选,检查出需要特别关注的患者。
张博士和他的同事已经成功将系统升级,现在的系统不止可以识别图像,还可以识别文本数据模式。“未来,医生们将节省下更多时间完成自己的本职工作。”张博士讲道。
人工智能系统诊断儿科疾病流程
“有时候,医生在诊断时无法考虑到所有的可能性”他继续讲道,“但这套系统可以提供‘抽查’功能,确保医生不会错过任何信息。”
除诊断系统外,张博士开发了一套实验系统。实验系统分析了中国广州妇女儿童医疗中心近60万患者的电子病历,将常见的病情与医生、护士和其他技术人员收集的患者详细信息联系在一起。
首先,专家们对患者的就诊记录一一注释,对识别疾病相关的信息打上相对应的标签。系统接下来将分析这些标注好的数据。
然后,将这些标注好患者病症的数据集输入神经网络。不久后,神经网络将自己建立起书面记录和观察症状间的关系,模型训练完成。
准确率超人类
在对未标记的数据进行测试时,该软件的表现可以与经验丰富的医生相媲美:医生在诊断哮喘方面的准确率从80%到94%不等,该软件的准确率已超过90%。
人工智能和医生团队在儿科疾病诊断水平的比较
在诊断胃肠疾病时,医生的准确率为82%至90%,而该系统准确率为87%。
在特定的情况下,神经网络可以非常强大,它能够识别人类永远无法识别的数据模式。但至于为什么神经网络做出了这些决定、他们到底是如何自学这类问题,就连专家也无法解释得清。
因此,为获得医生和患者的信任,专家表示张博士的这套系统仍需进行更大范围的临床测试。
诊断50余种儿科常见疾病的准确性均超过85%
“医学是一个非常严谨的研究领域,”佛罗里达大学医疗保健行业的深度学习研究员Ben Shickel说道, “人命关天,没有人会随意摆出一个不知道内部构造的黑箱子供医生或患者使用。”
尽管将深度学习系统大规模部署在急诊室和诊所还很遥远,但仍有一些项目有着可喜的进展:谷歌目前正在印度南部的两家医院进行眼科扫描系统的临床试验。
张博士说,基于深度学习的诊断工具更有可能在美国以外的国家蓬勃发展,尤其是在像中国和印度这样医生较为稀缺的国家。
张博士及其同事建立的系统得益于广州医院收集的海量数据。相较来看,美国普通医院规模较小,而且法律法规对于数据的收集和使用十分严苛,所以从美国医院收集来的数据集通常规模非常小。
张博士补充道,他和同事在未来研究中必将保护患者的隐私。但他不得不承认,中国的研究人员在收集和分析这类数据时可能更具优势。
相关报道:
https://www.nytimes.com/2019/02/11/health/artificial-intelligence-medical-diagnosis.html