这篇文章探讨了机器学习在改进诊断和治疗方面的应用。概述了机器学习如何改变生物医学的三个广泛领域:临床诊断、精确治疗和健康监测,目标是通过一系列疾病和正常的衰老过程保持健康。对于每个领域,都会讨论成功的机器学习应用的早期实例,以及机器学习的机会和挑战。当这些挑战得到满足时,机器学习将带来一个严谨的、基于结果的医学的未来,检测、诊断和治疗策略将不断适应个体和环境的差异。
从临床影像和分子检测中改进诊断学:临床试验的技术进步正在产生比过去的试验多几个数量级的数据。高保真成像测试现在可以生成组织和器官的二维、三维或四维(第四维是时间)图像,而分子测试可以提供对数百甚至数千个基因和蛋白质的评估。机器学习对于自动分析这些数据中与疾病类型、状态或治疗反应密切相关的诊断特征是必不可少的,也是普遍存在的。利用深度学习从生物医学图像中提取意义是当前研究中最活跃的领域之一。
机器学习应用如何帮助个人保持健康?在家里,机器学习可能有助于疾病的早期发现,监测对治疗的反应,并坚持治疗方案。在临床或医院中,机器学习可以帮助医疗专业人员对个别病人进行诊断和调整治疗。上图虚线显示了患者如何在家庭和临床环境之间移动,以及机器学习如何在每一步帮助维持健康。
多尺度建模和专家指导的精确处理:机器学习最有前途的应用领域之一是精准医疗,在精准医疗中,患者可以接受针对其个人疾病状况的医疗护理和治疗。精准肿瘤学的目标是根据肿瘤分子特征开出癌症治疗处方,这是机器学习在精准医学领域面临的挑战和机遇的一个典型例子。在目前的实践中,诸如体细胞突变和基因表达水平等单个分子标记常被用来告知治疗选择。然而,由于在其他基因组和表观基因组位点以及解剖疾病分布上的差异,患者之间的反应常常是高度可变的。更复杂的精密肿瘤学是,有数百种潜在的药物,并不是每一种组合可以测试的每一种疾病档案。精准医疗也将通过使用机器学习来自动挖掘和搜索出版文献和患者数据库中的专家知识而得到提升。
健康管理及监察:设想在如何治疗复杂疾病方面发生转变,从治疗的目标转向疾病管理的目标。这种全面的健康管理方法将努力通过一系列疾病和正常的衰老过程来保持健康。健康管理是一项艰巨的工作,因为它需要对潜在疾病的健康的各个方面进行持续监测,选择适合个别患者的治疗方法,并根据患者的反应调整治疗方法。
为了使机器学习在诊断和治疗中发挥变革性的作用,有必要开发高质量、精心管理的数据集。高质量的数据集有几个重要的好处:它们提高了机器学习方法的预测能力,同时减少了训练所需数据的大小和学习表示的复杂性。为诊断和治疗中的机器学习应用程序创建高质量的数据集将需要解决技术、法律和经济问题,这些问题常常导致未标准化的孤立的生物医学数据。为此,作者呼吁必须鼓励生物医学机构和个人参与数据标准化和共享。同样,保险公司、制药行业和支持生物医学研究的机构必须愿意投资基础设施、数据获取和数据管理,以生成高质量的数据。还需要促进用于学习的数据集多样性的数据共享方法和激励措施。这包括国家和国际数据共享标准,这使得从主要医疗中心和社区诊所获取数据成为可能。
然而,机器学习生物医学数据收集的最终目标是从患者群体中获得合适的代表性数据,以开发精确的机器学习模型,并将其推广到不同的人群。因此,还必须协调一致地努力考虑诸如治疗前患者状况、治疗方案、年龄、性别、种族、民族和环境暴露等变量。
生物医学机器学习应用需要严格的评估方法,特别是在需要持续学习的环境中。在作者看来,机器学习系统的性能最好是通过它在未来环境中的预测的准确性来衡量的。作者提倡一种迭代的机器学习方法,包括:使用回顾数据进行培训、算法锁定和部署,然后根据部署期间获得的预测评估应用程序的准确性。评估连续的学习系统——比如我们设想的那些必须适应健康状态或习惯变化的健康监测系统——可能需要加强这个循环,并使用在部署阶段收集的数据来检测限制或故障。不仅要对准确性进行量化,还要对置信区间进行量化,这一点至关重要,因为机器学习的某些用途比其他用途更能容忍不准确的预测,而且置信区间可以被医生用来为决策提供信息。由于大多数诊断和治疗测试假定模型和数据是固定的,因此迭代地培训和部署机器学习应用程序带来了监管方面的挑战。当模型根据新的数据更新或适应新的诊断或治疗时,需要进行评估以确保预测保持准确。为了确保对生物医学机器学习应用程序的健壮评估,需要多模态、可扩展和纵向的真实或模拟数据集。
虽然面临的挑战很艰难,但作者乐观地认为它们是可以克服的。此外,作者还认为这一努力是值得的,因为这将带来一个严谨的、以结果为基础的医学未来,检测、诊断和治疗策略将通过机器学习不断适应个体和环境差异,从而实现全面的健康管理。
原文文献:https://www.cell.com/cell/fulltext/S0092-8674(20)30284-1