为了培养 Watson 医生,IBM 已经花了几十亿美元。IBM 给 Watson 购买了大量病例,用循证问答的方式,类比大量相似的病例,给患者开出对应的医疗诊断。根据 IBM 的说法,目前在某些领域已经达到了顶级医生的水平。
可是即便花了那么多钱,你敢让 Watson 这个机器人医生看病吗?
IBM近日宣布收购Truven Health Analytics,收购价高达26亿美元。这是自Watson Health成立以来的第四次大型收购。
2014年4月,在IBM收购了Phytel和Explorys之后,Watson Health成立了,而这两家公司的共同点就是他们都是数据驱动型健康公司。去年八月,为了获取影像数据,IBM又花费了十亿美元让Merge Healthcare加入了Watson Health队列。
通过此次收购,IBM能获取Truven的云计算数据库、2500名员工和8500名客户,包括美国联邦政府和州政府机构、雇主、健康计划、医院、医生和生命科学公司。
Anil Jain通过Explorys的收购案进入了Watson Health,作为公司的副总裁,他表示,尽管Truven为IBM带来了许多关于成本、索赔、质量等数据,然而他们想要的并不只是数据而已。
Jain在采访中表示:“我们争取数据和资源是为了让它们发挥效用,帮助我们升级,让我们具有数据和知识的洞察力。”他还表示这些数据需要靠这2500名员工来分析,这些数据科学家、研究人员等专家都将进入Watson Health工作。
收购是一个方面,整合又是另一方面
Jain承认,想要将数据、人力和从收购中获得的客户基础整合到一个服务平台上确实有挑战性,但同时他也指出IBM有着大量的收购经验。他说:“Watson Health Platform正在努力为客户构建解决方案的核心技术‘云’。一些方案由我们来提供,而另一些则由我们的合作伙伴来完成。”IBM的合作对象有苹果、Medtronic、 Johnson & Johnson、Teva Pharmaceuticals、Novo Nordisk和CVS Health。
有些人担心IBM获取这些健康信息会侵犯个人隐私,Jain表示他也常常听到类似的质疑。但是对此他表示,首先他们严格按照HIPAA法案的要求替患者保密,其次他们所用的系统会向患者呈现详细的诊断结果,但是并不要求确认患者的身份信息。
Jain解释到,如果一个病症复杂的患者提供了一系列的患病症状,Watson就可以将具有相似症状的患者集合起来,抽取他们的数据,无需确定某一患者的详细信息,直接拟合模型。如果医生可以掌握流程、结果和医学杂志的数据,那他/她就可以从某一段信息中确认患者的状况,同时给出诊断和治疗方案。
Jain说:“在利益相关的生态系统中,人们可通过或好或坏的信息分享方式获取效益。消费者和患者则是我们努力的核心目标。”利益相关者包括患者、医生、保险公司和研究人员。
这些被收购的私人公司会继续留在他们的原有地点办公,而Watson Health将在马萨诸塞州的剑桥建立起总部。他们希望尽快看到公司面世。
Watson 医生工作原理
Watson 医生起初是一个研究项目,研究自动问答系统。例如,问:“谁是第一个登上印度次大陆的欧洲航海家?”。问答系统自动阅读大量文献,摘录出 “葡萄牙人,瓦斯科·达·伽马,于1498年5月20日到达卡利卡特”。又从其它文献中,摘录出 “卡利卡特位于印度西南部”。串联这两条信息,得出 “葡萄牙人,瓦斯科·达·伽马,于1498年5月20日,登陆印度” 。同理,找到其他欧洲航海家登陆印度的时间。最后排序,从而找到问题的答案。
IBM 研究院从 2006 年开始研究自动问答系统,并参与美国智力竞答电视节目,Jeopardy!这个节目与江苏卫视的 “一站到底” 类似,主持人出题,竞答者比赛准确性和抢答速度。5 年以后,2011 年 2 月,IBM 的自动问答系统,战胜了往届人类冠军,一举夺魁。
半年后,2011 年 8 月,IBM 决定把自动问答系统,应用到医疗领域。
以上是 IBM 自动问答系统的工作流程。整个系统围绕三个核心构成:
1. 自然语言处理
2. 基于循证的自动回答
3. 基于用户反馈的自学习和系统优化
其中,自然语言处理,和基于用户反馈的自学习和系统优化,大体上是常见技术。
这三个核心中,最有启发的是第二个,基于循证的自动回答。以往的电脑医生,基本原理都是专家系统,都是基于 if-then 式的规则,都是演绎法。而循证问答,基本原理是类比归纳法。通过类比大量相似病历,归纳出对应于某些症状,医生们通常习惯于做哪些检查。然后,类比相似检查结果,归纳出这些检查结果与哪些疾病关联密切。再然后,仍然基于相似病历的类比,归纳出对应于某一疾病或者某些疾病的组合,医生们通常习惯于开哪些药,等等。
从古希腊的帕拉图亚里士多德开始,人类的主要思想方法,是演绎法。到 17 世纪初,呐喊 “知识就是力量” 的培根,首倡归纳法。思想方法转变了,现代科学就萌芽了,随后就有了伽利略、牛顿、莱布尼兹等等科学巨匠。
循证学习依赖于海量病历。但是截止 2013 年 2 月,IBM Dr Watson 只收集到了 60 万份病历,此外还有 2 百万篇文章,2.5 万案例,1.5 万小时的门诊对话录音。远远达不到海量的数据规模。
怎么办?病历数量太少,做全科医生肯定不行。那就专门收集肿瘤专科的病历吧,全科医生做不了,那就先做专科医生吧。
为什么不惜工本的 IBM,花了那么多钱,只收集了那么一点病历呢?两个原因:
1. 美国人口基数小
2. 美国隐私保护法执行太严
反观中国,一家中等规模的三甲医院,5 年积累的病历数量,就超过 1000 万份。所以,在中国做循证学习,比在美国更有机会。
去年 7 月份,IBM 与美国最大的连锁药店 CVS,签署合作协议,通过 CVS 的 7600 店铺和 1000 家诊所,监测 7 千万患者的健康状态,尤其关注糖尿病、高血压等慢性病。今年 8 月份,IBM 花费 10 亿美金,收购医疗图像分析公司 Merge Healthcare。
这两个举措,似乎表明 IBM Dr Watson 在发展规划上,内部有争议。与 CVS 合作,似乎意味着 IBM 计划尽快开拓市场,为患者服务。而收购图像分析公司 Merge Healthcare,似乎意味着 IBM 打算深入肿瘤、眼科、骨科、皮肤病等专科,最终完全取代人类医生诊疗在诊疗过程中的各个环节。
2015 Watson Health 战略布局
四月
IBM 设立Watson Health后,先后收购了几家规模较小的医疗数据公司,并跟苹果、Johnson & Johnson和Medtronic建立合作关系。
同时,IBM携手美敦力改善糖尿病疾病管理。通过运用美敦力的设备、护理管理产品、疗法和辅导以及IBM的沃森医疗云平台(WatsonHealth Cloud platform)以优化患者的治疗效果和卫生经济学。
此外,两家公司还计划开发实时动态的个性化糖尿病治疗和管理方案,这些方案将为医生和病人提供决策支持,从而提高糖尿病治疗和管理的效率,改善临床效果。
之后,IBM宣布了两宗初创公司收购案:Explorys(一家可以查看5000万份美国患者病例的分析公司)和Phytel(提供云计算软件,可以把各种类型的健康数据进行处理,为医生提供数据方面的分析。
同时,Phytel也出售它的软件,帮助医疗人员掌握病人信息),目的是加强在健康数据分析方面的业务能力。IBM团队表示,两宗收购案将有利于IBM把先进的分析和认知计算技术运用于初级保健提供商、大型医院系统和医生网络中,提高医疗保健的质量和治疗效果。
五月
5月初,IBM走进美国和加拿大的14家肿瘤中心将部署沃森(Watson)计算机系统,根据患者的肿瘤基因选择适当的治疗方案。
月中,IBM与在线心理治疗初创公司Talkspace又牵手成功,IBM Watson将基于后者人工生成的心理医生匹配数据,通过机器学习,结合自然语言处理和用户个性分析技术,辅助用户决策,并帮助医生给出最佳治疗方案。
八月
IBM开始重拳出击,为Watson Health Cloud购买了一双价值数十亿美元的眼睛,以便它更好地检查患者。
8月6日,IBM宣布以10亿美元的价格收购医疗影像公司Merge Healthcare公司,并将其与新成立的Watson Health合并。届时Watson不仅可以读懂这些医疗图像,还可以根据巨大的电子病历数据库进行分析诊断。这将是Watson对医疗行业的又一次颠覆。
通过收购Merge Healthcare——这是一家总部位于芝加哥的全球医疗影像先锋企业——IBM增强了自身收集并传播影像的能力,而这正是通过机器学习诊断疾病的重要一步。
紧接着,IBM和美国第二大连锁药店CVS联合宣布,世界上最强的人工智能Watson将和CVS一起,通过对相关指标和用户行为的分析,来预测其健康状况。
在这次和CVS的合作中,CVS将向Watson开放海量患者行为信息、临床数据、购药数据和保险数据等。
通过对用户医疗健康记录、药店数据等信息的分析,可以预测用户患有疾病的风险,并向用户提供执业护士、医生以及相关的医疗保险等信息,为用户制定一个最佳的健康问题解决方案。CVS和IBM希望共同解决患者在病历和过往诊疗数据缺失的状况。
目前双方将第一阶段的合作放在慢病领域,包括高血压、心脏病、糖尿病和肥胖。这是医疗领域的一块最主要的市场。在美国,全年国民医疗总花费在29亿美元,其中86%的花费来源于慢病治疗。
此次和IBM合作的CVS是美国第二大连锁药店,在2015全球最具价值零售品牌中排名第11位,其年营收规模在1393.7亿美元。这次合作将覆盖CVS的7600家连锁药店,1000家医疗诊所。总辐射人群超过7000万人,占美国总人口的22%。药剂师、连锁医生和初级保健医生和专业医师的角色也将从根本上得以转变。
九月
Watson在痴呆症方面的研究初见成效。从 2012年 开始 IBM 研究院就开始跟学术和医疗机构合作,试图找出更快、更容易地发现引发该病症潜在风险的办法。他们想到的载体是—智能手机 / 平板电脑。
目前,检测痴呆症的主要手段是核磁共振、验血和尿检等,这些手段均需要潜在患者到医院才能进行检测。而很多老人往往对去医院持抗拒的态度,等家属好不容易说服他们去医院时,往往已经错过了早期发现的机会。
为了尽早发现痴呆症症状,研究人员决定简化和便利化这一检测过程。他们的办法是利用移动 app 和 IBM 的人工智能机器 Watson。
目前,IBM 的这项技术已经在参与研究的欧洲医生中得到运用。但是要想成为真正的产品,还需要经历严格的法律和监管审查。但是,这已经展示了机器的认知能力的进步—对人类退化的认知能力的认知,这似乎是人工智能的一个很深的隐喻
十二月
IBM 将Watson的认知语言处理能力延伸到了孕妇营养咨询领域,和孕妇营养咨询商 Nutrition合作开发出了一款营养查询app,它将Watson的自然语言处理和Nutrition的孕妇营养数据库相结合,为新晋妈妈提供个性化的膳食建议和24/7的营养数据查询服务。
美国国国立卫生研究院估计,在美国国内,每年有近四百万名妇女生小孩。根据2014年刊登在健康杂志上的一项研究表明,一般妇女在怀孕期间并没有机会接受足够的营养教育。据估计,每年有一万项营养学研究仅以英语发表,这就使得单一个人很难正确的制定个人营养方案了。
IBM当然知道这些,于是它找上了美国专业营养咨询平台Nutrition。当然,app起作用的前提是Watson已经学习了足够多的食物营养数据以及孕妇的个人历史信息,我想这也是IBM选中Nutrition进行合作的原因之一了。Nutrition庞大的孕妇个人数据库将能够帮助释放Watson在孕妇咨询领域的潜能,实际上,对双方和社会发展来说,这应该是一项多赢的合作。
Watson 要开始进入我们的生活吗?
IBM 除了围绕 Watson 的核心业务进行相关的收购外,还战略性的构建了生态环境。刚步入2016年的一个多月来,IBM已宣布了5项收购,其中3项和在线广告有关:
1、刚完成的设计与创新服务的德国机构 Ecx.io
2、跨渠道营销公司Aperto
3、数字营销代理公司Resource/Ammirati
IBM 的战略性任务是关于Watson、云端、分析等业务,但对于这些广告、营销公司的收购,建立了 IBM 更加完整的生态。Watson 所代表的新兴业务,尤其牵扯到治疗层面,技术只是其中的一方面,如何完成用户教育,并真正的在市场中铺展开来,并不是一件容易的事情。
想象一下,身为人工智能爱好者的我们,有多少人能够坦然接受人工智能医生开出的药方?