RiboFR-Seq:将16S rRNA与宏基因组连接的方法

2020-05-31 15:03:45 浏览数 (2)

摘 要

16S rRNA扩增子分析和宏基因组测序是研究微生物群落的两种主要的独立方法。近年来,许多研究将这两种方法结合起来使用,但下游的数据分析是分开进行的,在分类和功能上总是产生不一致或冲突的结果。

本文介绍了一种核糖体RNA基因测区域测序的新方法RiboFR-Seq,同时捕获核糖体RNA可变区及其侧翼的蛋白编码基因。

RiboFR-Seq不仅可以检测到研究较多的微生物群落中的绝大多数细菌,而且还可以检测到具有有限参考基因组的新群落中的绝大多数细菌。

RiboFR-Seq结合经典扩增子测序和Shotgun宏基因组测序,可以将16S rRNA和宏基因组的contigs的注释链接起来,做出一致的分类。

RiboFR-seq通过识别几乎所有的16S rRNA拷贝,可以有效地减少16S rRNA拷贝数变异引起的分类学丰度偏差。

背 景

16S rRNA扩增子的缺陷是16S rRNA 的多拷贝(1~15)会影响对细菌丰度的准确评估。且它不能提供关于宏基因组功能的直接实验证据。

Shotgun宏基因组测序的瓶颈是缺乏参考基因组和嵌合组装,影响了基因组组装和注释的准确性和可靠性。因此与16S图谱相比,它不能提供一个一致的微生物组成。且组装过程中高度保守的核糖体RNA序列往往被错误地组装在一起,或被视为重复序列而被过滤掉。

方 法

RDP数据库中下载细菌16S rRNA序列,挑出1400 nt以上的全长序列进行比对。比对后的序列通过限制性内切酶使用python脚本in silico进行消化(digested)。挑出可用的内切酶要满足三个条件:

1. 超过一半的序列可以被消化;

2. 只有一个识别位点,且离16S任意一个可变区很近;

3. 16S rRNA序列的粘性末端被裂解。

酶解的基因组DNA片段具有粘性末端,通过直接分子内连接实现自循环。

样本中16S rRNA的V4区和V6区被单独扩增;

通过长链反转录聚合酶链反应(long distance-inverse polymerase chain reaction,LD-IPCR) 从酶解后的环状DNA中获得基因组DNA片段。

(A)同时捕获核糖体RNA可变区及其侧翼序列;

(B)RiboFR-Seq的实验流程图。限制性内切酶的识别位点为6-bp,可以裂解细菌的16S rRNA序列,用于消化宏基因组DNA。酶解后的DNA片段具有粘性末端,通过分子内部连接的方式组成自循环,作为带有特异性反向引物的LD-IPCR模板。自循环后用外切酶消化剩余的线性基因组DNA。

数据分析。16S和宏基因组可以单独分析,也可以对应起来进行分析。对于一条序列,如果可以连接16S和宏基因组序列,则被称作‘bridge read pairs’(BRPs)

该方法可用于16S rRNA与宏基因组之间的一致性注释,准确定位组装后的contigs/scaffolds中的多个16S rRNA序列,辅助宏基因组的组装,并检测16S基因拷贝数。

结 果

RiboFR-Seq得到的物种注释更多且更准确,且可以对16S结果进行纠错。

用RDP和RiboFR-Seq对口腔样品16S V6得到的590个高丰度物种进行属水平注释。RDP分类器在50%的置信阈值下总共可以在属水平上标注330个物种。使用RiboFR-Seq,通过contigs的附加注释,89%物种可以在属水平进行分类。

C.16S V6区扩增结果。每个点为一个序列,大小表示丰度。连接表示两个序列存在单核苷酸差异。

D.三个菌16S与宏基因组序列。红点为16S rRNA基因,灰色为宏基因组contigs/scaffolds

END

0 人点赞