本文介绍如何利用人工智能(AI)最新的进展重塑临床试验设计的关键步骤,以提高临床试验成功率。
名词
AI:Artificial Intelligence,人工智能
Association rule mining:关联规则挖掘
BMI:Brain–machine interface,脑机接口
DL:Deep learning,深度学习
DRL:Deep reinforcement learning,深度强化学习
HMI:Human–machine interface,人机界面
ML:Machine learning,机器学习
NLP:Natural language processing,自然语言处理
OCR:Optical character recognition,光学字符识别
1
人工智能可以将反摩尔定律变成摩尔定律
将一种新药推向市场需要10至15年的时间,平均研发费用约15至20亿美元,大约一半的时间和投资用于临床试验。其余约一半的研发支出用于临床前化合物的发现和测试以及监管流程。
尽管制药和生物技术公司数十年来一直在不断增加研发投资,但每9亿美元获得监管批准的新药数量大约每9年减少一半。反摩尔定律对现有的临床开发业务模式构成了严重威胁,在重磅炸弹后的药物时代,如此大规模的上市效率是不可持续的。药物开发流程中的主要绊脚石之一是临床试验的高失败率。所有临床二期阶段化合物中只有不到三分之一前进到临床三期阶段。在临床三期阶段的化合物中,超过三分之一未通过批准。因为这些关键检查点要等到研发周期的下半阶段才会出现,最复杂的III期试验约占总试验费用的60%,所以每次失败的临床试验所造成的损失在于8至14亿美元,因此构成了研发总投资的重大削减。
图1 新药研发周期
导致临床试验失败的两个关键因素是患者队列选择和招募机制无法及时将最适合的患者带到试验中,以及缺乏技术基础设施来应对运行试验的复杂性,尤其是在后期没有可靠和有效的依从控制、患者监测和临床终点检测系统。AI可以帮助克服当前临床试验设计的这些缺点。机器学习,尤其是深度学习能够自动找到大型数据集(例如文本,语音或图像)中的意思模式。自然语言处理可以理解和关联书面或口头语言以及人机界面的内容允许计算机与人类之间自然地交换信息。这些功能可用于关联各种大型数据集,例如电子健康记录(EHR)、医学文献和试验数据库,以在试验开始前改善患者与试验的匹配和招募,以及在试验过程中自动连续监测患者试验,从而可以改善依从性控制并产生更可靠和有效的终点评估。在以下各节中,重点介绍了具有直接AI潜在入口点的临床试验设计方面,并解释了特定的AI技术及其应用将如何改善临床试验性能。
图2. 人工智能在临床试验设计中的应用。
2
患者选择
每个临床试验都对参与的患者提出有关资格、适用性、动机和赋权的个人要求。特定患者的病史可能会使他们失去资格。合格的患者可能未处于疾病阶段,或属于要测试的药物靶向的特定亚表型,因此使该患者不适合。合格且合适的患者可能没有受到适当的激励来参加,即使他们是,他们也可能不知道匹配的试验或发现募集过程过于复杂且难以导航。紧张的招募周期内招募足够多合适的患者是一项重大挑战,实际上是导致试验延误的第一大原因:所有试验中有86%不符合招募周期。患者招募占用三分之一的整体测试时间。患者招募带来了32%的失败率, 三期临床试验说明了国家的最先进的临床试验设计的最严重的缺点之一:具有最高的病人需求的临床试验遭受最低效患者招募技术。AI和ML驱动的系统可以帮助改善患者队列组成,并为患者招募提供帮助(图2)。
队列组成
临床试验通常不是为了证明在普通人群的随机样本中证明治疗的有效性而设计的,而是旨在前瞻性地选择一部分人群,在这种人群中,如果有效果的话,药物的作用可能更容易得到证明,被称为“临床试验富集” 。如果患者是先验的而不是合适子集的一部分,那么他们参与试验将自动降低所观察药物的疗效。在试验过程中,适宜性不能与治疗成功与否的程度相混淆:它表示一种状况,不会使参与治疗的患者对测试的药物产生完全或根本不可能的反应。招聘大量合适的患者并不能保证试验的成功,但不适合的招募患者增加了其失败的可能性。
协助招募
就数量和医学术语而言,试验资格标准的复杂性通常使患者难以理解和评估自己的资格。从庞大的非结构化数据源中手动提取有意义的信息是一项重大任务,给医生和患者均带来沉重的处理负担。但是,此步骤在很大程度上定义了患者是否被认为合适并有资格参加研究,以及招募地点和患者是否彼此了解。几种AI技术可以在自动找到EMR(电子病历)大海捞针中提供可行的帮助:NLP可用于理解各种结构化和非结构化数据类型的书面和口头语言。Fogel在最近的评论中提供了适用于临床试验设计的NLP技术的详细摘要。推理技术使内容可以概括为人类决策者可采取的行动。机器学习,尤其是深度强化学习,使系统能够学习并将有关其分析输出质量的反馈整合到适应的基础算法中。使用这些AI技术或其子集的辅助系统可用于自动分析EMR和临床试验资格数据库,查找特定患者之间的匹配并招募试验,并将这些匹配推荐给医生和患者。此类基于AI的临床试验匹配系统已被成功演示,并已证明其在现实生活中的价值。由于这些系统具有AI性质,因此将来增加的功能和改进的性能将主要取决于可用于分析模型开发和试点研究验证工作的数据的质量和数量。
还建议使用AI和ML技术来主动挖掘可公开获取的Web内容,例如数字试验数据库、试验公告和社交媒体,以自动识别相关试验和特定患者之间的潜在匹配。通过帮助患者进行常规的手动网络搜索,这样的系统可以使患者更快地了解感兴趣的试验,并允许他们主动与临床医生接触,以进一步评估合格性和适用性。
挑战
AI方法广泛使用的EMR数据的数字化和可访问性并非易事。由于相反的原因,这两项任务都是具有挑战性的:一方面,缺乏数据收集的监管框架会导致EMR格式差异很大,彼此不兼容或根本不是数字格式,并且存在于分散的生态系统中,而无需建立数据交换或访问网关。另一方面,严格监管的法律环境严格限制了第三方对患者数据的访问,甚至使患者自己难以访问自己的数据。人们普遍认为,这种所谓的“ EMR互操作性困境”是提高医疗保健系统效率的主要障碍,并且政府和医疗机构正在进行大量投资以克服这一障碍。同时,随着对敏感健康数据的管理和保护变得越来越复杂,诸如美国健康保险可移植性和责任法案(HIPAA)和欧盟通用数据保护法规(GDPR)之类的法律框架也在不断发展。此外,与EMR挖掘完全一样,对于临床试验而言,需要解决数据隐私和安全性以及法律对AI模型的充分解释性方面的匹配问题,以确保基于AI的系统可操作并获得监管部门的批准。
3
患者监护
招募合适的患者参加临床试验是一项巨大的时间和资金投入。仅通过成功完成试用才能获得此投资的回报。因此,必须让患者留在试验中,并在整个试验过程中遵守试验程序和规则,并且必须有效,可靠地收集所有用于监测受试药物影响的数据点。只有15%的临床试验没有出现患者退出的情况,整个临床试验中的平均退出率为30%。由于缺乏对试验方案的遵守而导致的退出需要额外的招募工作,这导致了试验延误和大量的额外费用。在试验中,非依从率的线性增加导致维持结果的统计功效所需的其他患者呈指数增加。AI技术与可穿戴技术的结合提供了开发这种节能、移动、实时和个性化患者监护系统的新方法。
患者依从性控制、终点检测和保留
为了遵守依从性标准,要求患者保留详细的药物摄入记录,以及与他们的身体功能,对药物的反应和日常方案有关的其他各种数据点。这可能是一项繁重而繁琐的任务,导致进入临床试验150天后平均有40%的患者失去依从性。可穿戴式传感器和视频监控可用于自动连续地收集患者数据,从而使患者免于此项任务。然后,可以使用ML模型实时分析此类数据,以检测和记录相关事件。这种方法可以生成疾病日记,因为潜在的分析DL模型会定期使用更新的测量数据进行重新训练,因此可以针对特定患者并适应疾病表达和患者行为的任何变化。这样的疾病日记可以作为依从性或缺乏依从性的证据,并且由于最少或不需要人工输入,也将比当前患者驱动的自我监测方法更可靠,更有效地收集数据点以进行终点检测。AI在基于图像的端点检测中也起着重要作用。目前,这一任务已在阅读中心手动完成。机器学习技术已经提出并最近获得批准,用于从医学图像中快速检测疾病的筛查应用。通过量化病理状况的算法对此进行补充。通过规避人工处理,将减少与基于图像的研究相关的成本。
AI和ML方法也可用于动态预测特定患者退出的风险,换句话说,是检测患者行为的发作,表明该患者可能会坚持研究方案。
使用DL进行图像和视频中的对象识别以及分析可穿戴式传感器的时间序列数据,最近已经开始或成功完成了用于测试和探索AI辅助患者监控系统的第一项研究。具有医疗级健康感测功能的市售可穿戴设备的出现,以及用于在此类移动平台上运行高级DL模型的互补软件生态系统,将使人们能够针对多种疾病研究更多种传感器组合。以前的研究中,Shah等人评估了使用低成本智能手机和其他即时医疗传感器与先进的生命体征检查相比,先进技术支持的非侵入式诊断筛查(TES)产生的临床证据的重要性和有效性。他们报告说,尽管常规的健康检查仍然很重要,但是TES的新兴技术在对人群进行分层以及提供个性化的检查和护理以支持临床试验设计和观察性研究以产生创新的新治疗方法方面可以发挥重要的协同作用。希望在不久的将来,以及正在进行的临床试验中,有更多的试验研究能够对此类技术对试验效率的影响进行基准测试。
4
总结和未来展望
新药开发过程的现状使大型制药公司和其他临床开发赞助商陷入了一个困境,即重磅炸弹时代已经结束,但增加新的药物组合的研发过程太慢且太昂贵无法弥补这种变化。要使范式转变到增长和进步的新可持续轨道,就需要对整个行业的基础业务和创新模型进行根本性的转变。
过去的5年中,现代AI技术已经达发展到了成熟的水平,可以在现实条件下使用它们,以帮助人类决策者进行计算机视觉、导航以及某些情况下的医疗和保健环境。同时,制药和医疗保健仍然是监管最严格,规避风险的行业。注入改变既定流程的创新是一项艰巨的任务,需要逐步解决和实施。尽管AI可能会影响从准备到执行的临床试验设计的许多步骤,但是任何旨在立即解决所有方面问题的AI都注定会失败。相反,数据科学家和医学科学家应该共同定义可实现的用例,在这些用例中,将易于理解的AI工具应用于临床试验设计的特定子任务,有望最大程度地改善整体试验性能。此类AI技术首先需要与旨在补充或替代的现有技术一起进行测试,并且必须以可解释、合乎道德、可重复和可扩展的方式对增值进行证明和基准测试。遵循这种方法,可以逐步将AI应用于临床试验生态系统,从而加快试验速度,同时希望降低失败率和研发成本。几家制药公司和AI公司已开始联合探索这一途径。监管机构已经建立并继续扩展框架,以评估医疗保健中基于AI的技术。
此外,已完成的试验已经积累了大量的数据,其中包含有关试验设计功能与试验性能之间的相关性的大量信息。这包括来自失败的临床试验的数据。这些大型且非结构化的数据集注定要由AI技术进行分析。可用于指导未来改进试验设计,也可用于研究已经试验的药物与药物再利用合并症的潜在相关性。然而,失败的试验数据尤其倾向于被忽略。
值得注意的是,任何此类步骤对药物研发管线效率的可衡量的影响(即使现在已成功实施)也要等5到8年的延迟之后,才能在统计中显示出来。此外,除了持续的费用外,还会有额外的研发费用;换句话说,从必需的投资角度来看,事情会变得更糟,然后才变得更好。
AI技术具有现实的实用性;但是,特别是在可解释性方面,这些技术必须成熟,以使其能够更广泛地应用于医疗保健和生命科学应用中。尽管这些发展正在如火如荼地进行,但需要承认通过AI改变药物开发周期的机会对所有涉及的学科以及通过严格的研发工作限定任何创新的价值和可靠性的责任重大。由于任何违反研究协议或过早设定不合理期望的问题,都可能无法绕开这个探索性研究试验阶段,这将不可避免地破坏信任,并最终损害AI在临床领域的成功。就像仅改变临床试验设计并不会将药物研发周期的效率从衰落转变为增长一样,人工智能并不是神奇的灵丹妙药,它不会使临床试验的成功率在一夜之间飙升。重塑临床试验设计和使用AI技术都是急需的药物开发周期大修的重要组成部分。
参考资料
Harrer S, Shah P, Antony B, et al. Artificial Intelligence for Clinical Trial Design[J]. Trends Pharmacol Sci, 2019.
https://www.sciencedirect.com/science/article/pii/S0165614719301300?via=ihub#s0035