近日,北京大学黄岩谊教授课题组在DNA测序方法的研究上取得重要突破,该团队在此前荧光发生测序技术基础上发展了一种全新概念的测序方法——纠错编码(简称ECC)测序法。据了解,ECC测序法采取一种独特的边合成边测序(SBS)策略,利用多轮测序过程中产生的简并序列间的信息冗余,大幅度增加了测序精度。
其中,DNA测序是指分析特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列方式。值得注意的是,快速的DNA测序方法将会极大推动生物学和医学的研究和发现,因此,在保证测序的速率基础上,如何提高和确保DNA测序过程的精度也是研究的关键。
据悉,ECC测序法以荧光发生测序技术为基础,其中,荧光发生测序技术的巧妙之处在于在DNA互补链合成时可以释放同所延伸核苷酸数目相等的荧光分子,利用这一反应可以实现低错误率的SBS。
A、C、T、G4种碱基,抽象成图中4个不同颜色不同结构的镂空立方体,可以通过3种正交的方式解构为两两组合。在ECC测序中,每个碱基均通过3次“投影”进行了测量,再通过3个投影重构出原来的序列。
在ECC测序法中,序列信息的冗余来自“对偶碱基荧光发生”SBS测序流程,该流程通过对测序试剂按对偶碱基分为两两匹配的三组,并对待测DNA序列进行三轮独立测序,继而产生三条互相正交的简并序列编码。
而这三条编码可互为校验,后续不但能够通过解码推导出真实碱基序列信息,而且具备对单轮测序错误位点的校正能力。
目前,ECC编码和解码策略已被广泛应用在信息通讯和存储等其它领域中,并被证实可以有效检测和纠正数据传输或存储时发生的错误。此次黄岩谊团队在测序技术中首次引入冗余编码概念,将进一步推动通信和存储技术的发展。据了解,相关研究成果已经公布在《自然》杂志上。