BDTC 2017丨聚焦大数据在医疗行业的最新实践

2017-12-21 17:55:47 浏览数 (1)

12月7-9日,由中国计算机学会主办,CCF 大数据专家委员会承办的2017中国大数据技术大会(BDTC 2017),在北京新云南皇冠假日酒店隆重举行。本次大会以“大数据与智能”为主题,聚焦最纯粹的技术干货分享,由近百位技术专家将为现场数千名的大数据行业精英、技术专家及意见领袖带来多场技术演讲,分享最新技术与实践的洞察与经验,探寻大数据发展的未来,领略数据与智能之美!

BDTC 2017中国大数据技术大会进入第三天,与会者热情不减。精准医疗大数据论坛在国家超级计算长沙中心副主任彭绍亮的主持下正式开始,将有来自上海交通大学生命学院生物信息与生物统计、军事医学科学院微生物流行病研究所、中国科学院上海生命科学研究院、军事科学医学院、中国科学院微生物研究所以及智超医疗的学界和企业界专家带来非常精彩的医疗大数据干货分享。

超级计算与精准新药发现

上海交通大学生命学院生物信息与生物统计系以及微生物代谢国家重点实验室长聘教授魏冬青

上海交通大学生命学院生物信息与生物统计系以及微生物代谢国家重点实验室长聘教授。Nature-Springer SCI期刊”Interdisciplinary Sciences – Computational Life Sciences”主编, “J. Mol. Graph and Modeling”, “Molecular Simulation”等10家杂志编委。发表SCI文章200多篇,主编专著9部,SCI引用 超过 5000次, H因子47。获得横山亮次(Yokoyama Ryōji)奖,上海交大科学技术奖和上海市优博导师称号。卫生信息学会大数据应用评估与保障专业委员会副主委、国际交叉科学学会会长。

作为首个分享讲师,上海交通大学生命学院生物信息与生物统计系以及微生物代谢国家重点实验室长聘教授魏冬青,带来了《超级计算与精准新药发现》的主题演讲。魏冬青表示,基因突变包括单核苷酸多态性(SNP)、核苷酸序列重复、插入以及缺失等,其可能会引起编码蛋白的氨基酸序列改变,导致蛋白结构变化而影响活性,也有一些位于调控区的基因突变可能引起功能蛋白表达量的差异。现已发现多种编码药物代谢酶、转运蛋白以及作用靶点蛋白(如受体)的基因存在着基因多态性,其中药物代谢酶基因多态性可能影响到药物吸收、分布、代谢和排泄的药动学过程,导致患者出现严重毒性反应或治疗无效。 我们开发了分子模拟与计算机辅助药物设计软件SAMM,构建细胞色素P450酶多态性基因型-表型相关性数据库。把支持向量机,神经网络,贝叶斯等非线性方法开发了统计预测模型以及基于web的软件工具并应用到药物构效关系,药物代谢以及毒理和基因表型相关性的研究中。 开发了SNPs及ADMET 在线预测平台, 并将其应用到各种典型体系,对个性化药物用药有一定的指导意义。

精准医疗的网络标志物

中国科学院上海生命科学研究院系统 生物学重点实验室执行主任、研究员陈洛南

中国科学院上海生命科学研究院系统 生物学重点实验室执行主任、研究员陈洛南,发表了《精准医疗的网络标志物》的主题演讲。据陈洛南介绍,相当多的证据表明,在复杂疾病发展过程中,恶化发展并不是持续的而是突发的。在这里,我们开发了一个无模型的方法来检测这种关键转变(或未发生疾病)的早期预警信号,即使只有少量的样本。具体而言,我们从理论上推导出基于动态网络生物标志物(DNB)的指数,其作为一般性的预警信号,表明在临界转变发生之前即将突然恶化。基于理论分析表明,预测从小样本突然转变是可以实现的,前提是每个样本都有大量的测量数据,例如高通量数据。我们使用三种疾病的基因表达数据来证明我们的方法的有效性。DNB与疾病的相关性也通过相关的实验数据(例如肝癌,肺损伤,流感,2型糖尿病)和功能分析来验证。DNB也可以用于分析非线性生物学过程,例如细胞分化过程。实际上可通过网络来标志物来诊断疾病,网络标志物是更稳定的形态,由此希望医学上所有生物所用分子标志物都用网络标志物代替,陈洛南认为网络标志物对精准医学更有帮忙。

利用微生物基因组测序大数据挖掘噬菌体暗物质信息

军事医学科学院微生物流行病研究所研究员、教授、博士生导师童贻刚

军事医学科学院微生物流行病研究所研究员、教授、博士生导师,复旦大学遗传专业理学学士,军事医学科学院理学博士,加拿大UBC博士后。长期从事微生物基因组学、病原体高通量测序筛查、细菌耐药基因传播机制及噬菌体研究。在Nature,PNAS,柳叶刀传染病等杂志发表了SCI论文120余篇。作为中国第三批医疗队首席科学家赴塞拉利昂参与埃博拉疫情防控。以第一作者身份在nature杂志发表埃博拉病毒进化研究论文被评为2015年度中国科学十大进展之一。

军事医学科学院微生物流行病研究所研究员、教授、博士生导师童贻刚,发表了《利用微生物基因组测序大数据挖掘噬菌体暗物质信息》的主题演讲。据童贻刚介绍,伴随着高通量测序技术的快速发展,产出海量的基因组测序数据,这些数据中蕴含的信息可以从不同的角度反复挖掘。近年来微生物基因组测序数据也像其他测序数据一样指数增长,大量测序原始数据中有价值的信息等待再次挖掘,这其中就包含细菌的病毒——噬菌体的基因组信息。随着细菌对抗生素耐药问题的日益严重,噬菌体及噬菌体治疗逐渐成为生物医学研究的热点课题。噬菌体作为细菌的病毒,广泛存在于自然界的各种生境之中,其种类和数量远远大于细菌。噬菌体除了作为抗生素的补充和替代品之外,其丰富的基因资源可以广泛用于各行各业,包括分子生物学研究、药物递送载体、表面呈现技术、三代测序技术、电化学、材料科学等等。噬菌体基因组序列包好噬菌体全部遗传信息,是了解噬菌体、研究和应用噬菌体的基础。对噬菌体进行基因组测序涉及噬菌体的培养、富集、核酸提取、建库上机、全基因组序列拼接、基因的注释、溶原性的判别、基因组物理图谱分析等等。本实验室近年来进行了大量的噬菌体基因组高通量测序和生物信息学研究,对上述的问题形成了一整套解决方法,积累了丰富的经验,独创一种非常实用的利用深度测序大数据确定噬菌体基因组末端特性的方法,发现了多种噬菌体基因组末端的特性;同时建立了预测功能性前噬菌体的方法,可以从细菌基因组测序原始数据及裂解性噬菌体基因组测序数据中发现隐藏的功能性前噬菌体的完整基因组序列。

基于深度学习的人类基因组智能解读

军事科学医学院研究员伯晓晨

伯晓晨研究员分别于1996年、1999年和2002年获得国防科技大学自动控制、模式识别和控制科学专业学士、硕士、博士学位,2003年开始从事生物信息学研究工作。现任军事医学科学院研究员、博士生导师、科技处处长。目前研究方向包括新一代测序技术、系统生物学等。作为负责人和主要研究者先后承担“精准医学研究”国家重点研发专项、国家重大新药创制、863、自然基金重大研究计划、自然基金重点、自然基金面上项目等18项。在Nature、Nature Microbiology、Nucleic Acids Research、Bioinformatics等期刊发表SCI论文50余篇。先后获得军队科技进步一等奖、国家科技进步二等奖、北京市科学技术奖一等奖等奖励。2007年入选北京市“科技新星”,2012年入选总后科技新星。现兼任北京自动化学会理事、中国药理学会网络药理学专业委员会常务委员等。

军事科学医学院研究员伯晓晨,发表了《基于深度学习的人类基因组智能解读》的主题演讲,其内容主要分为四个部分:后基因组时代的挑战;DNA复制时间域的识别;增强子的识别;RNA编辑位点的识别。伯晓晨表示,人类基因组计划的完成开启了后基因组时代,而后基因组时代的一个重要任务是对基因组的解读,特别是对占人类基因组97%的非编码区的解读。ENCODE等后基因组大数据计划的实施为我们提供了大量用于解读人类基因组奥秘的多组学数据,但同时也对海量多组学数据人工分析提出了挑战。在此背景下,我们尝试采用多种机器学习方法来实现人类基因组的自动注释。针对DNA复制时间域的识别、增强子的识别和RNA编辑位点的识别三这个重要的基因组注释问题,我们基于已经实验验证的结果建立了多个机器学习模型,实现了高精度的基因组解读。根据机器解读的结果,我们进行了全基因组的预测,并通过对预测结果的分析揭示了许多有趣的生物学现象。我们的结果表明,基因组信息学正在进入智能时代,未来我们完全可以依靠人工智能来解读人类基因组这部“天书”。

病原基因组学与进化

中国科学院微生物研究所研究员、中国科学院武汉病毒研究所研究员、中国科学院大学存济医学院教授刘翟

2000年于北京大学生命科学院获理学学士,2005年毕业于北京大学生物信息中心获生物信息学博士学位。是教育部授予的首批生物信息学博士。2005年进入中国科学院微生物研究所,历经博士后、助理研究员、副研究员,于2014年被破格提升为研究员。2016年被聘为中国科学院大学医学院教授。任中国微生物学会生物安全专业委员会副主任委员,中国遗传学会青年委员会委员,国际应急管理协会亚太卫生应急专业委员会常务委员,军委科技委国防科技创新特区主题专家。“生物安全关键技术领域”国家重点研发计划项目负责人。主要研究方向:病原基因组学与进化,生物信息学等。以通讯作者或第一作者在Lancet,Nature, Nature Microbiology, Nature Communications, Cell Host & Microbe等杂志发表研究论文20余篇,累计影响因子超过200,单篇论文最高他引213次。共发表研究论文80余篇,总引用次数超过3400次,H-index:26。

中国科学院微生物研究所研究员、中国科学院武汉病毒研究所研究员、中国科学院大学存济医学院教授刘翟,发表了《病原基因组学与进化》的主题演讲。传染病一直以来都是人类健康的重要威胁,据WHO统计每年全球有约1500万人因传染病丧生。病毒作为重要的传染病病原,由于其变异速率快、遗传与传播模式独特,经常会造成较大规模的暴发与流行。近年来,国际上相继出现了(禽)流感病毒、埃博拉病毒、中东呼吸综合征冠状病毒、寨卡病毒暴发等事件,严重影响公共卫生和全球经济的发展。明晰传染病病原的进化与传播规律是制定科学有效的传染病防控策略的必要前提,具有重要的科学价值和现实意义。相较于传统的病原学研究方法,基因组学和生物信息学能够更加快速的对于病毒的进化规律进行解析,成为病原研究的重要热点之一。此次分享主要围绕病毒进化与传播规律,利用病毒基因组学和生物信息学作为主要手段,面向禽流感病毒起源、进化模型、遗传变异和传播动力学等科学问题展开。主要揭示人感染H7N9禽流感病毒的起源、进化与传播规律;指明我国人感染禽流感频发的根源;解析了我国H5N6禽流感病毒的进化规律。通过研究以H7N9和H5N6为代表的禽流感病毒在我国的进化规律,指出了活禽市场与活禽交易是我国禽流感大面积流行的最主要原因,为传染病的精准防控提供了重要依据。

医疗健康大数据驱动下的人工智能医生

天河”生命科学方向负责人、国家超级计算长沙中心副主任、华大基因研究院“特聘教授”、湖南大学岳麓学者特聘教授彭绍亮

彭绍亮,教授,博导,在国防科技大学计算机学院从事高性能计算、大数据、生物信息、移动计算等技术研究工作,并担任“天河”生命科学方向负责人,国家超级计算长沙中心副主任,华大基因研究院“特聘教授”,湖南大学岳麓学者特聘教授。已发表学术论文数十篇,其中包括Science, Nature Communications, Cell AJHG, Genome Biology, NAR, Cancer Research, ACM/IEEE Transactions, BIBM,《中国科学》等。曾参与天河系列超级计算机应用软件研发工作,参与国家973项目、863项目、军队重大型号项目等13项,获军队科技进步一等奖1项,2016年荣立三等功。是中央军委科技委生物交叉立项专家组成员、国家科技专家库专家、中国计算机学会理事(2016-2019),CCF计算机应用专委会副主任和生物信息专业组副主任,YOCSEF长沙主席(2016-2017)和总部AC委员(2017-),CCF高性能计算、大数据专委委员、CCF高级会员和杰出讲者、担任多个国际期刊主编和副主编。

天河”生命科学方向负责人、国家超级计算长沙中心副主任、华大基因研究院“特聘教授”、湖南大学岳麓学者特聘教授彭绍亮,发表了《医疗健康大数据驱动下的人工智能医生》的主题演讲。近年来国家大力推行分级诊疗制度,移动医疗,远程医疗方兴未艾。同时存在,三甲医院就诊人数密集,分导诊能有效提高医院运行效率;现有的分导诊简单粗暴、准确度差,病人满意程度低等问题。而建立临床医疗诊断辅助决策平台的主要目的之一就是提高医疗的安全性和诊疗质量,减少医疗差错,增加病人的就诊体验。目前基于天河超级计算机研发了有三个技术,智能化无人值守体征采集一体机(目前覆盖16大项,128个小项)、基于大数据的分导诊人工智能机器人、临床医疗诊断辅助决策平台。三种技术都是基于天河超级计算机和国家超级计算长沙中心进行大数据管理分析和人工智能模型计算的。目前系统已经在国内多家三甲医院部署和使用,挂号准确率提升到99%,降低患者挂号时间约25%,降低分导诊中心工作量40%。误诊率下降20%以上,处方有效率提升30%以上,看病时间减少80%以上。

0 人点赞