ISICDM大会发起人李纯明教授:重新审视医工交叉与医疗AI研究

2019-08-29 11:15:45 浏览数 (1)

近两年的AI医工交叉方法论,工,以数据驱动为根本,忽略领域知识的作用;医,则扮演数据标注工人的角色,医生的医学领域知识难以发挥作用。但由于医学的独特性,我们需要重新审视两者的角色和关系,医生应该参与到算法开发的过程中,医生的医学知识和临床经验应该融入到算法设计中。

——李纯明

李纯明是个“粗线条”的人,每次在自己发起并一手筹办的图像计算与数字医学国际研讨会(ISICDM)上,或是因为太忙,开幕式发言他几乎不做准备,颇为随性,时而前言不搭后语,他自己以及台下的观众从不觉得这有什么不当。

如参会者所说,这才是真实的李纯明。

李纯明也是个完美主义者,每当参加完ISICDM大会之后,不由感慨他对大会内容质量的把控之严格,主题设置之细致。

这也是真实的李纯明。

原本10分钟的采访,由于他的各种“发散”,最终进行了2个多小时,直至凌晨1点。采访过程中,他多次强调一个问题:一个学术会议,无论是组织方邀请嘉宾,还是观众听报告,不要单纯冲着讲者的知名度和职位,而应该关注会议的学术内容。对于ISICDM这样一个理工医大融合的会议,更要加强跨学科的交流,以促进不同专业人士的学术交流与合作,激发产学研医协同创新与技术落地。

“我组织会议过程中,会针对会议的主题跟一些嘉宾预先交流一下他们报告题目和内容的安排,对嘉宾我会建议他尽可能把一个工作的 ‘ 是什么,怎么做,为什么 ’解释清楚,让听众知其然还要知其所以然,就是一个好报告。而不是像记流水账似的把自己和团队的做过的研究项目一一汇报。”

电子科技大学李纯明教授

ISICDM大会发起人兼大会程序主席李纯明长期专注于图像分割和三维重建及相关问题的研究,其在图像分割和水平集方法的研究中作出了有国际影响力的重要贡献。

自2005年以来,李纯明教授以第一作者的身份发表了一系列关于图像分割与水平集方法的原创性研究论文,在国际学术界产生较大的影响,被世界各国学者频繁引用,其中一篇水平集方法的论文(2005年发表在CVPR)单篇他引次数超过2500次。

李纯明2008年发表在IEEE TIP(图像处理领域的顶级期刊)的论文,在经过五年的时间考验之后,于2013年荣获IEEE信号处理学会最佳论文奖(注:该奖每年从过去五年的IEEE信号与图像相关的多个著名期刊中,经权威专家评选出不超过六篇最佳论文,李纯明教授的这篇论文是2013年获得最佳论文奖的唯一一篇图像处理方面的文章)。时隔两年之后,李纯明因为2010年发表的另一篇IEEE TIP论文的重要贡献而获得了2015年IEEE信号处理学会最佳论文奖。值得一提的是,李纯明是国际上唯一一位以第一作者身份两次获得这个重要的国际学术奖项的学者。这两篇论文都已成为水平集方法和图像分割领域的经典文献,国内外很多学者在这两个工作的基础上做了深入的研究和应用。在发表10年之内,这两篇获奖论文的单篇他引次数都超过了1500多次。

此外,李纯明以第一作者身份还发表了一系列同时分割与校正磁共振图像灰度不均匀性的算法论文,在国际上率先开展了对超高场强(如7T)磁共振成像的图像分割与灰度不均匀性校正的研究,巧妙地把磁共振图像的成像模型结合在图像分割与灰度不均匀性校正算法中,有效地解决了超高场强磁共振图像灰度不均匀性校正的难题。其中发表于2011年的一篇IEEE TIP论文,在发表之后不到八年,单篇引用率已经超过980次。

重新审视“工”

一直很低调的李纯明教授,每次谈到现在火热的AI研究时,他便打趣到,很多人把他当做人工智能的学者,但实际上他并不会把自己定位为AI学者。

“现在人工智能的概念被滥用了,我们做的图像处理与分析算法,因为能实现某些自动化的功能,很容易被外行当作成人工智能。因此,我也算是广义的人工智能专家了。”

李纯明谈到,他现在并没有专门研究当前热门的深度学习,而是更喜欢应用变分法、偏微分方程和矩阵计算等数学理论和方法解决图像处理和计算机视觉问题。

其实早在上一波神经网络火热的年代,当时的李纯明便已专门研究过神经网络的基础理论问题。

“我的本科和硕士都是基础数学专业,后来转到应用数学领域研究的第一个课题:研究神经网络中的函数逼近问题,比如激活函数满足什么充分必要条件才能保证对应的神经网络在某个函数空间中可以无限逼近其中任一给定的函数,还研究了用神经网络逼近抽象无穷维空间(如希尔伯特空间)上的非线性泛函或算子。当时我觉得那样的研究有点理论脱离实际,加上后来因为我出国读电子工程博士而中断了神经网络的数学基础研究,后来选择了更感兴趣的基于变分法和偏微分方程的图像处理作为我的博士论文课题。”

而谈到最新一代神经网络大背景下的AI话题时,李纯明指出“深度学习是基于神经网络的万有逼近能力。应用泛函分析、测度论和傅里叶分析的理论可以证明,只要激活函数不是一个多项式,神经网络就可以任意精度逼近任何一个连续的输入输出系统(即数学上的连续映射)。”

“深度学习有一个吸引人的地方:原则上,它在不同的应用中都可以用同样的训练算法框架,只需要替换训练数据和相应的标注进行训练,就能训练出一个具有某种输入输出关系的多层神经网络。然后在应用的时候,输入一个数据,系统就输出一个结果,应用的过程可以做到全自动。但这种看起来一劳永逸的框架,在实际应用中还有一些局限性。”

李纯明解释道,这是因为医学图像数据是复杂多变的,不同厂家的成像设备,不同的成像参数选择,和成像设备的更新换代等因素都会导致图像性质(如信噪比、分辨率和伪影等等)的变化,以及不同病人与病情的差异也会导致图像特征的变化。

训练数据如果不够“大而全”,一旦遇到一个跟训练数据有一定差异的数据,有时只是加了一点噪音,神经网络输出的结果可能就会出很大的错误。但训练数据要多“大”多“全”?也没有一个客观的量化标准。

深度学习需要用医生手工标注的数据,还要求训练数据和手工标注符合一定的标准。但数据的标准化也没有一个通用的法则可以遵循。深度学习的调参也没有规律可循,调参的难题至今没得到实质性的解决。这些都可能会给深度学习的应用带来不确定性,在不同数据集上的性能可能会很不一样,鲁棒性较差。

在医疗领域的应用上,深度学习的不可解释性也是个很大的问题,医生和病人都很难接受这种不可解释的诊断结果和治疗方案。李纯明认为,深度学习在医疗领域离真正的落地还有相当大的距离,还需在理论和技术上有所突破。学术界研究深度学习不应太工程化,应该多研究一些基础性的理论问题,提出更有原创性的算法。

谈到近年来的深度学习热,李纯明认为学术界不应该一窝蜂的跟风做深度学习。

学术研究还是应该多元化,要做到百花齐放,百花争鸣,这样才更能有创新,也有更大的机会产生有实用价值的技术。数据驱动的深度学习只是数据处理的工具之一,而且有它的局限性。

在有些应用上,传统的方法也能解决问题,而且可能解决得更好,应用起来更简单,为什么不用它呢?李纯明经常说“做研究应该以解决问题为目的,也就是做问题驱动的研究,而不是方法驱动或热点驱动。”然而,最近几年学术界跟风的趋势还是很明显的,现在CVPR等计算机视觉的顶级会议的投稿量大增,也是因为跟风做深度学习的学生太多了,加上门槛低,还有开源的代码可以用,所以CVPR等顶会的论文大多都是深度学习的。

确实,近三年众多CVPR审稿人纷纷向雷锋网表示,他们看到了CVPR、ICCV、ECCV等顶会上的诸多论文,有很多不同的网络设计想法和切入角度,这些扎实的工作推动了现有体系、架构的一步前进,但是,却普遍缺乏实质性的进展,深度学习的几个主要局限性仍然还没被突破。

医学,最重要的问题之一便是可解释性。而当前工科会议的论文,基于不可解释的深度学习研究成果几乎成为主流。

上述问题的本质是,由于科研人员做的研究总体偏工程,较为缺乏原创性和突破性的基础研究,导致工程技术开发正在进入瓶颈期。

“我认为,从眼前来讲,不应该一窝蜂都用数据驱动的深度学习。一些医学图像算法的开发也应该针对不同的应用,去设计不同的算法,开发者尽可能在算法中融入领域知识,设计出针对特定应用的个性化的方法,而不是对每个病种都在TensorFlow或Pytorch等开源框架上用不同的数据进行训练和调参。而在深度学习这种数据驱动的学习过程中没有利用领域知识的机制, 因此技术的开发也就不需要开发者与医生的交流。医生在技术开发的过程中只起到了对训练数据手工标注的作用,也就是说医生被当作人工智能背后的‘标注工人‘来用了。“

“数据驱动的深度学习不可能包治百病,并且其不可解释性在医学应用上很难让医生和患者放心使用。从长期来讲,数据为王的医学影像AI研究方法,在未来遇到的问题将会越来越多。而创造出可解释的、更加精准的、不过度依赖数据的方法,应该是医工交叉中,工的目标。”

2018年的ISICDM大会上,MICCAI学会创始主席James Duncan、原TPAMI副主编Baba Vemuri、罗切斯特教授罗杰波等人均提到了研究“Fundamental problem”的重要性,并指出当前多数学者更多停留在简单的工程问题,缺乏在基础研究上的突破性进展,企业界的技术开发也因此遭遇瓶颈。

与此同时,现在的深度学习其实是一个有问题的框架,多用大数据和很多标注数据来训练,这在过去几年很成功,但不代表是正确的方向。当前计算机视觉的系统是一个(特征为)Training System的训练,而不是一个Learning System,现阶段需要从Training System变成Learning System,让机器主动,并结合数据的结构、时间空间结构去学习,而不是被动地用人工训练来标注它。

目前行业走的是粗放型发展路线,是靠堆积数据和计算资源来换取高性能,这是资源而不是效率的竞赛。在大家把医学影像分析聚焦于Data Set的大环境下,虽然在工业界已有一定的成果,但李纯明坚信,原创性技术和基础研究,更值得工科人去关注和投入。

而两届ISICDM大会的议程设计也是逆潮流而上,设置了数学以及基础理论的分论坛和系统性的系列讲座,意在让更多工科学者打好理论基础,并站在新的视角,以更高的观点去看待和解决问题。

此外,李纯明也谈到,举办大会邀请嘉宾,他更希望讲者分享的理论研究方法,不但走在最前沿,同时也经历过时间的验证。

秉承这一理念的李纯明,已经把ISICDM打造为具有理工医跨学科特色的医学影像大会。

重新审视“医”

医学AI是门交叉学科,技术与产品的创新,离不开医生的引导。

李纯明通过举办两届ISICDM大会,意识到了自己过去的认知错误。

“过去很多人觉得医生比较保守,不愿意接受人工智能,这是一种误解。近两年医生非常想和理工科的专家合作,只是没有找到合适的点。”

李纯明回忆道,今年在几次大会中听广东省人民医院梁长虹主任、北京大学第一医院王霄英主任等知名医生的报告时,才发现原来很多医生有自己的智能工程研发团队,而且医生对AI的认知也越来越成熟。

因此,在第二届ISICDM大会上,为了让医生与工科人更全面地交流探讨,李纯明也特地安排了“医工交叉科普讲座”、“医生谈临床需求与挑战”、“医工交流会”、“医学影像数据分析软件培训”等分论坛。全场600多名参会人员,其中来自全国各地的医院主任医师超过百位,即便是重量级医生专家,也是全程听完三天的大会报告和圆桌探讨。

“王霄英主任在ISICDM大会上谈到一个观点让我印象非常深刻,她认为,很多医学影像软件,没必要都用人工智能,有时候我们医生只是需要图像处理能够自动化,就会对我们医生很有帮助。她说传统的图像处理工具对医生还是很有用,但目前在临床上还没被充分利用。这句话让我知道,我们要做的第一步并不是把技术打磨的多智能,而是把医生需求摸索清楚。”

李纯明认为,工科人员做医学图像研究,也应从临床的角度考虑问题,研究的目的应该是解决临床问题,或者为临床应用提供理论指导,不能只是和医生合作搞科研发论文,而不解决问题。在ISICDM大会上,多位报告专家也完全附议李纯明的观点。

讯飞医疗CEO陶晓东从工科角度出发,谈到了这个问题,他认为医疗行业,技术不仅要为影像科、病理科服务,还要为临床服务。服务于临床是最高目标。

在这个过程中,医生的指导非常重要,需要用正确的工具解决正确的问题,即先准确地定义问题,然后寻找合适的解决手段。

“一个问题如果能用九十年代的技术解决,就不要想着用2000年的技术;如果能通过人和机器一起解决,就不要想着做全自动的方案。总之,不要总想着用最新的技术,关键是要能解决实际问题。回归到医疗行业,我们的首要目的是要解决临床问题。”陶晓东谈到。陶晓东的说法就是李纯明一直坚持的做问题驱动的研究的观点。

同样,第一届ISICDM大会主席田捷在接受AI掘金志采访时说到,医生能不能接受某项智能技术,关键看临床效果,看能不能针对临床解决问题。

田捷谈到,虽然他是工科人,但近几年却没有发表过计算机方面的文章,而是发医学文章。此外,他也几乎没有参加计算机视觉会议,反而经常出席美国临床肿瘤学会、美国肿瘤学会等这类会议。

他强调到,技术人员要穿上医生的马甲,到医学的会议上交流。

“过去工科人经常在计算机视觉会议上谈自己在医学图像分析上的方法和参数有多好,我觉得意义不大。你要到临床医生那里,让他们‘折磨你’,找出医生能接受的临床效果和临床意义,这时候你的模型才真正起作用。”

“现在我能在医学杂志上发表文章,由于审稿人都是医生,这说明我的研究具有一定的临床意义,同时也证明我已经穿上了医生的马甲。”

这也是田捷、李纯明等众多ISICDM专家重新审视完“医”后的新认知:技术人员需逐渐改变工科思维,站在医生的角度去思考问题,多跟医生交流,学习医生的专业知识,并把知识融入算法中,同时让他们来当裁判,用医生的标准给你的成果做评价。

· 推荐阅读 ·

田捷:《基于AI和医疗大数据的影像组学研究及其临床应用》

0 人点赞