作者 | 明明
编辑 | 鸽子
不是医生,是不是意味着不能从事医疗行业?
答案是否定的,如果你不是一名医生,你还可以是一名码农。
2017年,AI行业飞速发展,其中医疗AI获得巨额融资,却被大家称之为是最难和AI相互融合的行业,那么现在医疗AI发展的现状究竟如何?针对这个问题,营长专访了医疗领域人工智能领军企业Airdoc的创始人张大磊,将本次的专访以故事的形式呈现给大家。
午后,在望京的一个咖啡厅见到了张大磊。
他身穿红色的毛衣,微瘦,带着眼镜,手中端着咖啡杯,一边向我走来,一边说:“不好意思,刚刚在咖啡厅一楼和朋友谈事情,耽搁了一会儿”。此时,我们坐在这家咖啡厅二楼的大堂中。
在已然过去的2017年,张大磊的创业公司Airdoc站在了“AI风口”上,当各大科技巨头都在谈AI的时候,学医出身的张大磊,早已将自己的事业同AI紧紧的绑在了一起。
2017年,医疗AI飞速发展。据亿欧智库发布的《AI 医疗报告》显示,国内医疗人工智能公司累计融资已超过180亿人民币。在看到AI的巨大潜力后,各处的资金向医疗行业涌来,这也使得一大批新兴企业争相加入这个行业。
2015年,学医出身的张大磊初入医疗AI时,这个行业并没有太多人做,出去和医生说AI医生觉得离自己很遥远。在刚刚过去的一年内,这个行业受到投资机构关注,一笔又一笔上亿元的融资使得医疗AI这个行业逐步从小众而走入大家的视野中,并变得异常的火热。
但是在张大磊看来,这种火热的现象并不会持续太久。“医疗AI不像互联网一样可以快速崛起、快速暴富,医疗AI的发展是一个漫长的稳步向前的过程。”张大磊坚定的说道。
不可否认,医疗AI的未来十分光明,甚至可以获得巨额的回报,但在那之前,还将经历一轮又一轮的洗盘。
全身心投入医疗AI领域三年后,张大磊对这个行业也有着自己独到的看法,在他看来这个行业可以分为五大类。
第一类:影像识别
影像识别是医疗AI的入门阶段。比如说从肺上面看一个结节,在一个大片子上识别结节,这对人工智能来说难度不高,对医生来说也没什么大的挑战。
原来大家设想的场景是:医生看很多片子,每天非常累。
实际上在中国,大多数的医院里面,下午放射科患者并不多。只有特别牛的三甲医院人到下午快下班都非常多,但是这些医院下午的患者门诊量也不及上午。普通医院下午放射科人很少,并不存在片子多的实在看不过来的情况。
“没有AI的时候,你也没见谁拍了片子没拿到片子,或着拿了片子医生没告诉你问题。”张大磊说。
但是为什么这么多人做这个领域呢?因为门槛相对较低,放射科都是标准化的设备,基本的设备数据格式都差不多,基本上每个公司都会认识几个医院的放射科医生,都能去放射科拿到脱敏数据去标一下。
还有的通过网上的公开数据集,直接下载下来。放射科获取数据较为简单,同时也是壁垒最低的,谁都可以做,获得融资的公司中90%集中在这个领域。
但在这上面,价值创造可能有限,为什么呢?AI能看到的东西,医生也能看到,目前阶段还不存在比专家看的好很多的状态;另外,对病人来讲的话,病人更想知道片子上有病没病?有什么病?并不是只想知道是否有结节,如果有结节的话,病人还想知道是良性还是恶性怎么分型怎么治?
现在不少公司做的都是从片子上检测一下结节,但病人想知道的良恶性判断,是需要结合起来病理来看的。通过一个放射片子直接把良恶性做到专家一样准,还需要一个过程。
第二类:问题分诊疾病
通过询问问题诊断出这个人患有什么病,这一类也有很多人在做。大多数做自然语言处理,学习病例、教材、文献,到最后判断出来有什么问题。
问题分诊疾病要比读肺结节更加有“中国场景”。可以替代一些全科医生的部分工作,中国特别缺全科医生。全科医生在国外保险公司愿意买单,最好能够早发现早治疗,自己在家处理一下,不要耽误到很严重才去医院,那样保险公司花的更多。
张大磊认为在商业保险上,中国比不上美国的环境,美国的商业保险较为完善。
张大磊之前也做过问题分诊疾病这项业务,有十几万基层医生每天在用,但在中国很难赚钱,中国保险行业没有起来,政府也不会出资买这些东西。
只有商保能起来,这块自然也就跟着起来了。
但是这里面,有个最大的问题是,在以往的实际经验中,病人往往说不清楚哪里不舒服,很多人只是说“我不舒服”,“我不舒服”这件事情没有任何可用的有价值的信息。如何让患者准确描述体征和症状,这是分诊疾病的一大问题。
第三类:基因、微生物研究
理论上来讲,如果能够取到所有人的基因数据、对应每个人的临床表现、身体特征这些东西,就可以拿算法训出来哪个基因和胖瘦有关?哪个基因和锻炼有关?哪个基因和帕金森有关?
然后就可以取出来这样东西,实际上基因微生物获取成本相对高一些,也没有人把所有基因微生物全部训出来,但这个机会是存在的。
比如说肥胖,有的人怎么吃都不胖,有的人稍微吃点就发胖,这个就由体质来决定的。
所谓体质要么就是先天的基因,要么就是微生物或者是肠道菌群,有的人怎么吃都不胖,可能因为降解代谢的非常快,如果把这个人所有的肠癌道菌群移植到另外一个人身上,另外一个人吃肉也不发胖,这样的话,控制体重相对来讲就是简单的事情。可能不需要运动,也并不胖。
医疗上很多问题要搞定的话必须要有专业的医生教授,再有做算法的人在一起才行,单纯的让一堆做算法的人来做比较困难。张大磊举例说,如果做算法的人可以搞定一切的话,Facebook、谷歌、微软会是全世界最牛的医疗公司,很显然不是的。
这一类是张大磊非常看好的一项内容。
尤其是微生物这块,微生物可以调节,所以理论上来讲存在一种可能性是大家每天想吃啥吃啥想睡就睡,也不锻炼,但是你每天吃饭的时候喝个特别的益生菌,就会永远不胖,这是有可能的。
怎么做到呢?或许可以找一些特别胖的人,再找一些特别瘦和正在变瘦的人,把肠道菌取出来,拿算法跑一遍对比发现差异,再把有差异部分做成一个能喝的饮料或是粉末每天扔到水里喝一下。
这个机会很明显比“影像识别”大,“影像识别”只能卖给医院,而这个则是每个家里都可以用的。当然,在研究阶段,对采集样本的能力要求很高。
第四类:新药研发
在研发药物的很多环节上都可以拿算法改进。
研发药物时,做临床实验的时候需要找一些病人来吃这个新药,找病人入组条件也比较复杂。
举个例子,医生们想要找一组没有被任何方式治疗过的老年痴呆的病人,同时刚好年龄在60-65岁,女性,刚好不抽烟不喝酒,没有任何心脏问题等等各种问题,同时每周来做一次检查。
另外一组就是正在吃某一组药,吃了两年时间,同时其他条件一模一样,这样筛上一千人,光是这个时间就得花上一两年时间。
一个药上市晚一年损失就要用多少亿来算。
如果有一个算法从全部病历中批量筛出来有这些问题、这种条件的人,就能够快速找到符合要求的病人。在药物研发上面,还有药物不良反应监控上面,也是大市场。
在美国,有很多人做这个事情,药厂愿意出钱,就像问题分诊场景中保险会出钱一样,但是在国内做的非常少,因为中国原创药很少。
“这一块,对中国还有个特别的机会。”张大磊说,我们有很多中医、古方、汤剂。拿算法把里面全部抽出来也是一个机会。
举个例子,最简单的抗病毒这件事情,在以前所有的古书中和抗病毒相关的提到的方子,几百几千个肯定是有的,这些里面哪些是可信度高的如张仲景、李时珍提出的,哪些是可信度低的如偏方,里面同时显示的成分或是组方高频存在,说明与这个东西更可能有关系。
在张大磊看来,把历史上中药文献全部拿算法过一遍找出来里面有价值的部分,会非常的有意思。说不定就可以医治某一些不好治的病。
像疟疾那么难治的病,死那么多人,最后青蒿素可以发挥作用,我们国家过去了几千年,这几千年出现很多聪明人做医疗,只是没有被很好的传承下来。但是这些医书都在那放着,让一个个人把历史上所有这些医书全部读一遍不太现实,可能一辈子都读不完,但是用算法中间抽一些东西是很有可能的。
第五类:食物营养成分研究
现在有很多问题实际上吃出来的,你看我们现在饮食习惯,都不用更久远,我们父母一代人吃的东西都和我们年轻时候不一样的。
从健康角度来说,实际上二三十年前中国人吃的东西可能比现在吃的东西健康,我们现在心血管、糖尿病发病率有多高,为什么呢?
在过去多少年里面,我们并不是每个人都随时随地可以吃肉。我们天天吃谷物的肚子,现在变成天天吃肉的,基因并没有快速的改变,像糖尿病、高血压、动脉硬化会越来越多。
以前在古代的时候盐比较珍贵,不是超市里面随便买一个,合理的量是一天吃6克盐。我们现在谁吃6克盐,统计一下发现绝大多数每天都是超标的,随便吃上一个咸饼干可能就比6克多了。
张大磊介绍说,我们之前做的APP,在吃东西之前拍张照片,中餐我们拿人工算法识别出来这是什么菜?有什么样元素?有什么食材?高血压病人能不能吃?糖尿病人能不能吃?这些东西从未来长远来看具有更高的商业价值。
例如,在食用一个三明治时,在APP上面拍一张照片,算出来这个东西大约有多重?里面营养成分分别是什么样的?里面有多少碳水化合物?多少的热量?多少的重金属?多少的微量元素?
这样的话,每个人在吃东西的时候有所控制,对每个人健康状况都是非常好的。
外国人在在购买东西时会习惯的看一下包装上都有什么营养元素和热量,我们则没有这个习惯。这是为什么呢?我们祖先在几十年前吃的都比较健康,他不需要每天看这些东西,他吃五谷杂粮,现在我们的食物结构发生了变化,可以吃饱了,但是人们按照膳食指南吃东西的习惯没有养成。
现在大多数人吃的蔬菜水果是偏少的,可能精细的主食和肉吃的偏多的,这实际上可能并不利于身体健康。
中国每天就诊有两千万人次,如果按照15亿人基数来算,这意味着大多数人只有在扛不住了才去医院。实际上有差不多三亿人身患某种非致命性的慢性疾病,但是他自己可能不知道。
举个例子,很多糖尿病人高血压病人不知道自己的病情,一年中参与体检的人次才是几百万,有很多人都不去体检,导致的后果是本来花五块钱能解决的事情,非要等到花五千、五万才去治。
在这个现实面前,真正对中国价值创造最大的是把有慢性病的人能够早期发现,同时给予很好的干预。
除了介绍医疗AI上的五大类别之外张大磊还讲述了医疗AI上,现阶段的两大怪象。
怪象一:医疗AI扎堆影像识别
无数人冲到“影像识别”这里。我们真的需要这么多放射科算法大夫吗?是不是让大家少生病更有意义?
实际上放射厂商是非常强的,如GE飞利浦西门子这些世界五百强,在中国每年销售额百亿千亿这样规模,他们能把一个几百万几千万的设备卖到医院里去,客户关系自然是现成的,数据又多,专家关系又好,算法本身也差不多,那可能对设备厂商来说“影像识别”做起来或许不会太难。
长远的结局是什么呢?放射厂商做这块之后,加到硬件中售卖或者送出去这项业务,对创业者和投资人都将会是一个巨大的压力,该如何应对这种情况呢?
“有一些公司把医疗想的过于简单,从网上下公开数据跑跑,在资本热潮下拿到一些投资,我认为这些创业公司可能不好成功。”
为什么呢?门槛相对较低。
“我们公司2015年就做过结节,敏感性特异性很不错,实际上我们也不觉得这有什么神奇的,我们结节算法是实习生做的,比大家想象的简单很多。”张大磊介绍。
单病种的算法相对多病种来讲门槛低一些。举个例子,之前拍照识别皮肤病,人的皮肤病几千个,不能拍完照告诉他这不是湿疹,得告诉他这是什么病,单病种对病人来说用处有限。病人想知道自己什么病该怎么治,因为病人在就医前大概率不知道自己是什么病。
就像上面判断的没有结节,实际上对病人来讲也意义有限。如果你不舒服,你咳嗽跑到医院去拍片子,医生给你出的报告说你没有结节,你肯定不满意,你肯定想知道:我有没有肺炎?我有没有肺结核?有没有其他问题?你不会只想知道我没有结节。
在张大磊看来,放射科AI盈利机会更多属于设备厂商。
怪象二:患者数据获取监管空白
在医疗AI的研究中,无疑是需要数据的,这就需要数据合作。有这样几个方式:医院、学会、专家、政府。
绝大多数的企业只是与几个个别专家合作,从法律上来讲的话患者数据不属于专家,这也意味着许多公司未来是会吃亏的。
和医院和卫计委和医学会合作流程较慢,有的时候签协议一年就过去,时间非常长,但是必须要做的。
有一些公司搞上几个专家直接把医院数据跑出来带着所有患者敏感信息,从法律上来看数据不属于专家,未来可能会面临监管上的一些问题。
另外一方面,拿出来的数据可能还存在很多信息标注的偏差问题。
一般一个医院医疗体系里面拿出来的数据都有某种偏见,这个医院一直都以这种方式看,另外一个医院以那种方式看,数据重新让三家以上医疗机构标,大多数公司不做这个活,因为这对资源整合要求比较高,只有和这个领域里面比较牛的专家和比较牛的医院合作,让他们独立的标注数据,结合完整病历,标注取得一致部分,才有训练价值。
结语
对于AI医疗的发展来说,张大磊认为医疗AI想要获得像新药一样盈利,对这个行业来说至少还需要十年时间。因为医疗行业是一个比较难以改变的行业,整个医疗行业发展很慢,在人身上使用的东西是非常慎重的,首先要确保安全有效,其次再说经济成本。
显微镜从被发明出来到被所有医生普遍用上花了百年时间;射线从发现到大量医院开始拍X光,又花了几十年时间。
AI从开发到运用到医疗上,需要多长的时间还不可知,但是就目前的社会进程来说,新的事物的发展更新迭代速度变得非常的快,也许不再需要几十年的时间甚至是几百年的时间。
这个行业需要致力于高科技研发的AI人才,与医院医生相互协作,共同致力于医疗AI的发展。也许你不是一位医生,但你是一位码农,那么很高兴的告诉你,医疗AI同样需要你。