师弟新作 | NBT:王运浩、区健辉等综述纳米孔测序技术

2022-01-19 14:41:54 浏览数 (3)

2021年11月8日,美国俄亥俄州立大学(Ohio State University)区健辉(Kin Fai Au)研究组在Nature Biotechnology在线发表综述论文Nanopore sequencing technology, bioinformatics and applications该文章系统全面地回顾总结了纳米孔测序技术的发展历史、技术原理、数据特征、生物信息学分析方法以及广泛的应用, 同时也指出了目前存在的问题。

自从牛津纳米孔技术公司(Oxford Nanopore Technologies, ONT)于2014年推出第一款商业化的纳米孔测序仪MinION以来,近几年纳米孔测序技术以及相关的应用都取得了实质的进步。ONT纳米孔测序技术的原理主要依赖于具有生物传感性、内部直径为纳米尺度的蛋白质(nanopore)。在电解质溶液中,通过施加电压,将带有负电荷的单链DNA或RNA分子驱动穿过纳米孔。同时,利用分子马达蛋白(motor protein)控制DNA或RNA分子的穿孔速度。DNA和RNA碱基序列穿过纳米孔传感区域时所引起的电流变化被实时记录,并通过生物信息学算法将这些变化的电信号解码为核苷酸碱基。

米孔测序的概念最早可追溯至20世纪80年代【1】。目前的纳米孔测序技术主要包括两个核心组分:纳米孔蛋白和分子马达蛋白。第一个被用于纳米孔测序的纳米孔蛋白为alpha-hemolysin, 其内部直径为1.4至2.4纳米;随后,另外一个具有相似内部直径(1.2纳米)的蛋白MspA也被证实可以用于纳米孔测序。分子马达蛋白(比如phi29 DNA聚合酶)的应用使得DNA或RNA分子穿过纳米孔蛋白的速度得到了稳定的控制,进而极大地改善了测序的准确性;同时,分子马达蛋白可以将双链DNA或者RNA-DNA杂合体解链为单链分子。

图1. 纳米孔测序原理图

图2. 纳米孔测序发展

截至目前,ONT公司相继更新了8个版本的测序系统(从最初的R6到最新的R10.3版本),并推出了适合不同测序通量需求的测序仪 (比如,中等通量的GridION、高通量的PromethION)。ONT测序的准确性从最早的64%增加至如今的95%;目前的测序长度(N50)可以达到50 kb,报道的最长测序长度为2.273 Mb【2】;测序通量也得到了较大的改善,目前,单个PromethION 芯片(flow cell)可以产出大约150 Gb DNA测序数据。特别值得注意的是,ONT可以对RNA分子直接进行测序,因此保留了RNA上的表观修饰信息(比如, m6A)。

图3. 纳米孔测序建库流程

图4. 数据分析流程

进一步,该文章概述了基于ONT测序数据的生物信息学分析模块:碱基识别(base calling)、DNA(比如,5mC)和RNA(比如,m6A)表观修饰的直接鉴定、测序读长(read)的错误矫正、序列比对(alignment)、基因组组装、结构变异检测、基因组重复序列分析以及转录组分析。基于对近些年已发表文章的系统统计,作者详述了ONT测序在11个主要方面的应用:完善已有的参考基因组序列,构建新的参考基因组,鉴定相对较大的基因组结构变异,构建全长转录组并分析复杂的转录事件,研究基因组表观遗传标记,检测RNA表观修饰,以及在癌症、感染疾病、遗传疾病、病源监测和其他方面的定点(on-site)应用。最后,作者指出了未来ONT测序需要改进的层面:更高的测序准确性(>99%)、更长的测序长度 (Megabase)、降低测序所需的DNA和RNA样品量。

该文章为了解纳米孔测序技术的原理、特点、分析和应用提供了详实的信息。区健辉课题组的王运浩博士、赵月博士以及研究生Audrey Bollas为共同第一作者。

区健辉课题组(http://augroup.org)长期致力于第三代测序技术(PacBio和ONT)领域的研究,主要涉及第三代测序技术在转录组、表观基因组和表观转录组方面的方法学开发以及生物学应用。

原文链接:https://www.nature.com/articles/s41587-021-01108-x

引文 :Yunhao Wang, Yue Zhao, Audrey Bollas, Yuru Wang, Kin Fai Au. Nanopore sequencing technology, bioinformatics and applications. Nature Biotechnology 2021,39:1348, https://doi.org/10.1038/s41587-021-01108-x

0 人点赞