哪些保健品和药物不能同服?这个AI搜索引擎能告诉你

2019-10-31 11:48:06 浏览数 (1)

药不能随便吃,药和药是会发生反应的。

补充剂 (如保健品) 也不能乱吃,它们和药物之间,也可能相互作用。

举个例子,许多失眠小伙伴吃过的褪黑素,便与许多药物有反应:

包括抗凝血药、抗血小板药物、抗惊厥药、避孕药、治疗糖尿病的药物和免疫抑制剂……

艾伦AI研究所的科学家,改造了著名的谷歌语言模型BERT,让它学习过往的医学文献,来分析补充剂和药物之间的作用,还开发了一个搜索引擎

只要输入一种补充剂,或者一种成分的名称,就会得到一个列表。

一个推特网友,把褪黑素输进去,收到的列表包含了520种可能和它有反应的物质。

不止如此,每种可能反应的物质,都有相关论文的对应句子,可以点开查看:

有了它,普通人也可以轻松查到,一种保健品,是不是可能和自己正在服的药/保健品产生冲突。

当然,团队也严正声明:信息仅供参考,不能代替医生建议,所有情况都请咨询医生。

BERT:哪里需要哪里搬

那么,团队改造的BERT,是怎样的一只AI?

为了便捷,此处先介绍词汇:

补充剂-补充剂相互作用,简称SSI

补充剂-药物相互作用,简称SDI

药物-药物相互作用,简称DDI

由于补充剂受到的监管不甚严格,有关安全性的信息,并不十分充足。也就是说SSISDI的相关记载比较匮乏;

相比之下,药物受到的监管就严格许多,有关药物间相互作用 (DDI) 的数据,过往文献也就记载得更加充分,形成了庞大的语料库:

所以,机智的科学家想到先用DDI语料库,训练一个改造版的BERT,让它学会分辨一个句子里面,药物和药物之间有无关联。训练好的模型就叫BERT-DDI

然后大概是考虑到,凡生物医学文献,用语习惯会比较接近。这样,用DDI数据训练好的模型,应该能迁移到SDI和SSI上。

第一步,从PubMed文献库里面,抓来2200万篇论文 (的摘要) 。这里用到了艾伦研究所自家的学术搜索API,名叫Semantic Scholar。 第二步,用scispaCy从摘要里筛出带有补充剂和药物的句子,扔给一体化医学语言系统 (UMLS) ,这样就算一种补充剂/药物有很多名字,也可以被统一成相同的表述。 第三步,把统一了表述的句子们,交给训练好的BERT-DDI,让它去判断句子里一种补充剂和其他物质的关系。假如得到阳性 (Positive) 评定,就表示两者有相互作用,要记录下来。 第四步,所有的阳性结果,都对应了一些句子,以及句子所在的论文;只要把它们整合起来,再加上检索功能 (支持模糊搜索) ,就有了SUPP.AI引擎。

这里,包含了55946种相互作用,涉及了1923种补充剂,2727种药物。

只要输入补充剂的名字,输入某个成分的名称,都能搜索出可能与它相互作用的物质,以及依据的论文。

当然,也可以输入药物名称,毕竟AI是用药物数据训练的。

那么问题来了,用药物数据训练的BERT-DDI,在补充剂 (SDI/SSI) 身上做的判定,到底准不准?

测试环节,团队手动标注了200个样本,交给AI做判断:

得到了87%的准确率,77%的真阳率,96%的召回率。

真阳率=真阳/ (真阳 假阳) 召回率=真阳/ (真阳 假阴)

基本告捷。

在补充剂的安全性资料不足的今天,这个搜索引擎也可以为普通人,提供一些“不能一同服用”的信息了。

不过,由于数据是AI自动提取和分类的,没有经过领域专家/医疗专业人员的验证,艾伦研究所也在引擎上方,写了一份免责声明:

此处包含的信息,不得用于代替执业医师的建议。 此工具不可替代执业医疗保健从业者提供的护理,强烈要求用户在所有情况下咨询医师。 如果某种药物、补充剂,或它们的组合,没有显示警告,不可解释为这种药物、补充剂或组合是对患者安全、有效或适合的。 此处提供的信息,仅供参考。 此工具可能无法覆盖所有可能的、补充剂与药物之间的相互作用。 如果您有健康问题或者疑虑,请咨询医师。 虽然,我们试图提供准确、最新的信息,但无法保证这一点。 此工具不为任何药物或补充剂做背书,不对患者做诊断,也不推荐任何治疗方法。

总之,这只是一个初步的尝试。搜出什么不得了的信息,也要向医生求助才好。

实验室的人类们

SUPP.AI搜索引擎的一作,是来自艾伦AI研究所的Lucy Lu Wang

本科毕业自麻省理工 (MIT) ,硕士毕业自约翰霍普金斯大学 (JHU) ,今年夏天从华盛顿大学 (UW) 博士毕业,专业是生物医学和医学信息学 (BIME) 。

不过,Lucy和艾伦研究所的初次相识,还是2017年。从6月到12月,在那里实习了半年。

今年,她终于正式进入艾伦研究所,成了一位青年研究员 (Young Investigator) 。

Lucy在接受采访的时候说,信息学会改变医疗的未来。而现在,她和小伙伴们才刚刚开始:

SUPP.AI搜索引擎的作者团

NLP医疗研究的缺失

AI越来越多地被整个医疗行业采用,其中最主要的是用计算机视觉来解决医疗问题,希望让AI能够像人类一样读懂核磁共振、CT、X光片,甚至比人类发现病症更加敏锐。

但是在医疗领域有很大一部分信息并不是图像,而是以文字形式呈现。例如体检报告、临床实验室报告、手术记录和出院记录等等。而这些信息往往是非结构化,对计算机来说也是难以理解的。

另外医学研究论文发表的速度相当之快,医生需要从卷帙浩繁的学术杂志中找到和自己领域相关的最初成果也是相当不易。

自然语言处理 (NLP) 技术的出现,会帮助解决这些问题,它能够做到:

1、从大量医疗数据中学习特征,然后使用获得的知识来协助临床的诊断和治疗;

2、通过提供期刊、教材和临床实践这些医疗信息来协助医生,为患者提供适当的医疗服务。

不过相比于视觉,NLP在AI医疗领域的研究相对小众,虽然也有像大公司,比如IBM Watson利用NLP来帮助医生进行辅助诊断的尝试,但收效甚微。

据IEEE Spectrum统计,8年来,IBM Watson与其他机构合作的25个具有代表性的项目中,仅有5个合作项目推出了AI医疗产品。

目前,美国监管机构只批准了少数AI工具用于医院。并且,这些产品主要还是在视觉领域发挥作用。

NLP在医疗上面临着重重困难。去年7月,据泄露的IBM内部机密文件显示,Watson会给医生提出一些“不安全的错误治疗意见”,甚至在极端的诊断案例中,这些错误甚至可致患者死亡。

连2019年图灵奖得主、深度学习三巨头之一的Yoshua Bengio也认为,在医学文本文件中,人工智能系统无法理解其模糊性,也无法了解人类医生注意到的微妙线索。到目前为止,没有AI可以达到人类医生的理解和洞察力。

Supp.ai的出现,表示NLP不必执着于医学诊断,在药物领域也可能有用武之地。

Supp.ai搜索传送门:

https://supp.ai/

论文传送门: https://arxiv.org/abs/1909.08135

0 人点赞