从百度飞桨助力开源肺炎CT影像分析模型,看开发者的“无声抗疫”

2020-03-02 07:46:58 浏览数 (1)

进入三月,令人揪心的新冠疫情在国内逐渐得到了控制,春天似乎正在悄然到来。

回首过去的一个月,是中国科技承压颇重的一个月。不仅大量行业面临着线上化、远程化、无接触化转型,社会各个环节的防疫工作中,同样也需要技术能力的支持。仿佛短时间内,社会中出现了无数个大大小小的反应场,考验着科技能力在其中激发的化学反应。

从目前来看,结果还是超乎意料的。像是短时间内很多人流密集的交通站点部署了AI测温系统,减轻人工测温带来的拥挤低效。也有大量实体商家通过SaaS向电商转型,以保证商业运转。同时我们还能看到,AI医疗也正在发挥着作用。就在最近,连心医疗基于百度飞桨开发的“基于CT影像的肺炎筛查与病情预评估AI系统”已经上线并部署在了湖南郴州湘南学院附属医院,利用AI医疗影像来提升医生诊断和评估效率。

借着这一最新的落地案例,我们不妨来看看,在疫情大考中,百度飞桨交出了一张怎样的答卷。

读秒阅片:AI如何改变肺炎诊断

其实产业各个环节的数字化和AI化,已经不算是什么新鲜的话题。从过去一年开始,很多企业都高举起AI进入工业大生产的旗帜,开始着手推动产业生产的技术变革。其中医疗影像凭借着天然的数字化基础,与AI的图像分析能力又格外契合,其AI化进程自然走在各行各业前方。乳腺影像诊断、眼底图像诊断等等细分领域,都在去年取得了不少落地性进展,尤其缓解了医疗劳动力资源紧张的问题。

就拿这次抗疫来说,肺部CT是新冠肺炎筛查和诊断的重要依据,在治疗过程中,医院还需要在不同阶段多次检查影像以进行对比。但矛盾的是,抗疫时期有大量病人需要护理,医院工作本来就很紧张,而新增疑似病例也需要尽快筛查以得到适当的治疗手段。诊断、病情发展跟踪、治疗效果评估等等任务上都落在了医疗影像上。但人工阅片显然在效率上有限,并且难以实现一些精细对比需求。

这时连心医疗基于百度飞桨所开发的肺炎CT影像分析模型就可以发挥作用,数据显示这一系统可在几十秒内完成对患者CT影像的病灶检测、病灶轮廓勾画、双肺密度分布直方图及肺部病灶的数量、体积、肺部占比等全套定量指标的计算与展示。至于准确率方面,该系统在测试数据集上的病灶检测精度和召回率分别达到92%和97%,不仅漏检几率极低,也能很好地完成诸如后续阶段性治疗效果跟踪比对这类对于精细度要求较高的工作。同时有了这一系统,一些在基层医疗机构就诊的患者也可以通过远程医疗得到更精准的诊断,进而减少患者在大医院聚集带来的风险。

一方面释放医院的人力资源,同时提升诊断效率,让更多患者及时得到治疗。可以说在这次抗疫中,AI医疗影像发挥了其一贯的作用。

想要应对这次疫情的挑战,仅仅靠AI医疗影像“一贯”的作用是远不足够的。

我们可以回忆一下,以往AI医疗影像从研发到应用的过程是怎样的。大多数时候,是行业参与累积一个开放的数据集,经由医疗专家对图像中的病灶进行标注,再将数据集公开开来,以竞赛等形式号召科技企业参与攻克。当企业训练出准确率足够高的AI模型后,通常还要和一家家医院进行逐一的落地适配——因为不同设备在成片分辨率上的细微差别,都有可能对模型的准确率造成影响。

这种我们已经习以为常的复杂流程,显然不适用于新冠肺炎的紧急情况。

凿井铺渠:肺炎战疫背后的百度飞桨

如果说技术本身是滋养一切的水流,那么从开凿井口到铺设渠道,让水流真正输入土壤中的整个过程,和水流一样重要。

这一次连心医疗的肺炎CT影像分析模型能够快速落地,切实解决抗疫需求的背后,除了医疗科技企业的技术累积,百度飞桨所发挥的凿井开渠作用。

作为基于产业实践的开源深度学习开发平台,我们可以将飞桨之上医疗AI影像技术从诞生到应用分为研发和落地两个区段,看看百度飞桨是如何在同一时间对两个区段同时进行加速。

首先是凿井,也就是研发阶段。

医疗AI在研发中最常遇到的困难,就是“技能分配”问题。相信大家在玩游戏的时候,都遇到过“点技能树”问题,既选择修炼A技能后,往往很难在B技能上同样也达到高水准表现。同样的,很多医疗AI科技企业在医疗专业能力上非常擅长,但在将专业技术AI化、模型化的工作上,效率就不那么理想了。例如加快AI模型研发、解决数据样本少等工作,就很容易对医疗AI企业形成困扰。这时百度飞桨这样深度开发学习平台,就能够提供很好的互补作用。作为AI头雁企业,百度自然在深度学习、图像识别等等技术上有着更高的建树,并把这些先进的技术能力通过平台输出给连心医疗这样的开发者。

在这次肺炎CT影像分析模型中,连心医疗就应用了百度飞桨提供的PaddleSeg开发套件。PaddleSeg的一个重要特点,就是内置了十余种数据增强策略。新冠肺炎这样需要在短时间内部署应对的新型疾病,在模型研发时最容易遇到的问题就是数据样本不足。这时PaddleSeg的数据增强能力就可以很好的发挥作用,通过对原本数据样本的处理,扩大样本集来提升模型训练效率。同时PaddleSeg还具有模块化设计的特征,包含了数种主流分割网络,并打包成了“即拿即用”的形式,极大地简化了模型开发的复杂程度,让连心医疗这样的企业可以将更多精力投入在病理表现、病灶形态等等更切合医疗专业的地方。

凿井之后的开渠,也就是这次肺炎CT影像分析模型所面临的最大挑战——落地。

为一家医院开发一套AI阅片系统并不困难,但面对新冠肺炎这样覆盖全国乃至世界的传染病,显然需要的是将这一系统尽可能的布设到更多医疗机构中,才能为整个社会增强疫情应对能力。尤其一些基层医院可能并不具备高分辨率的设备,如何在这些平台实现灵活部署,是百度飞桨参与攻克的首要任务。

在百度飞桨与连心医疗的合作中,系统采用的深度学习算法模型充分训练了所收集到的高分辨率和低分辨率的CT影像数据,以适应不同等级医疗机构中的CT影像设备。加上PaddleSeg所具备的工业级部署能力,也能更快完成和医疗机构设备的对接。

更重要的是,当很多其他技术企业也在攻克肺部CT识别技术时,百度飞桨和连心医疗已经创新式地通过EasyDL定制化训练和服务平台将这一模型开源,开发者可以在EasyDL图像分割模型中找到这一专用算法,通过少量数据训练即可获得基于实际场景进一步优化的模型,并可以利用多种模式进行部署。

换句话说,面对这样一场覆盖面如此之广的灾难,不论是连心医疗还是百度,或者任何一家科技企业,都无法独自承担将技术部署到每一家医疗机构的重任。只有将模型开放在EasyDL这样尽可能抹平技术应用门槛的平台中,才能让更多人在技术本身之上加以开发利用,来应对开发场景上的细节差异,以及未来可能出现的病灶表现改变等。同时帮助更多在攻克这一命题的开发者共享成果,提升进度。

凿井铺渠之后,百度飞桨还通过开源精神,把涓涓水流变成了人人都能取用的水源。

释放双重价值:百度飞桨在疫时和未来的答案

技术开放,是百度所代表的技术企业一直在宣扬的口号,也是百度飞桨一直在执行的概念。但在当下这种时刻,我们比以往更加明确的感受到了技术开放的价值。

在这次疫情大考中,我们看到了百度飞桨通过开放精神所释放出的“双重价值”。

第一层显然是技术价值。

像百度这样科技巨头,其能力构成上必然具备着先进技术和先进落地经验的一致性,通过飞桨这样的平台,百度可以同时把先进的纯粹技术和先进的落地经验输入给开发者。让他们去填补中间的一环,利用坚实的技术骨架支撑起解决方案,然后使其稳稳地扎根于产业世界。这次百度飞桨通过PaddleSeg帮助科技企业更好、更快的研发出针对疫情的AI模型,就是其中的表现。

第二层则是开放精神释放出的社会价值。

在这次疫情中,我们在百度飞桨上不仅能看到开源的肺炎CT影像分析模型,还有首个开源的口罩人脸识别检测模型,相信现在已经有很多企业以及个人开发者,在这些模型上继续开发,将水源引入更广阔的疆域。这是我们在面临社会问题时,一种默然的协作模式,不同层级的开发者把解决问题的能力开放出来,不断向下游传递,直到覆盖社会每一个角落,成为我们与灾难抗争的推助力。在这一过程中,释放的不仅是百度飞桨一个平台或百度一家企业的社会价值,还有每一个参与其中的开发者,并且鼓励了更多手握力量却不知如何使用的人,告诉他们技术能够为这个社会带来切实的改变。每一行代码都是一颗冲向灾难的静默子弹,每一位开发者都有机会成为“抗疫奇兵”。

一款新冠肺炎AI辅助诊疗系统,显然不会是百度飞桨价值释放的终点。这场考试尚未停止,相信百度飞桨将会在更多产业以及社会场景凿井开渠,为抗疫输出AI能量。更重要的是,水源一旦被打开就不会停止,而是不断的孕育生机。在这次抗疫中发挥价值后,将会有更多人意识到技术开源的社会价值。在未来,或许会有更多开发者会选择开源合作,更好地用技术抚平整个世界的褶皱。

水源的珍贵之处正是如此,它可以赋予万物生机,又可以持续蜿蜒,将生机一直传递下去。

0 人点赞