RNAseq建库方法

2022-10-25 20:03:38 浏览数 (2)

背景

当前 RNAseq 主要研究的是 mRNA,由于一次转录过程中,mRNA 只占很少一部分(约 4~5%),需要采用特殊的建库方式将 mRNA 从总 RNA 中分离出来。常用的方式有两种,一种是根据 PlolyA 尾巴进行富集,另一种是降解 rRNA 的方法。两种方法各有优缺点,下面分别进行阐述。

一、polyA 富集

由于真核生物成熟 mRNA 会在尾部加上一个 polyA 尾巴,可用于富集 mRNA。但是原核生物没有该特性,因此不能采用该方法,另外,有一部分 lncRNA 也具有polyA 尾巴,因此该方法也可以捕获部分包含 polyA 尾巴的 lncRNA。

目前大多数发表的 RNA-seq 数据都是基于 oligo-dT 方法富集包含 poly(A)尾巴的转录本,但是这种方法除了会导致 3ʹ端偏好外,很多不含 Poly-A 尾巴的非编码 RNA,例如 miRNA 和增强子 RNA 不会被测到。短链非编码 RNAs(如 miRNA)既无法用 oligo-dT 方法富集,因此对其研究需要特定的分离建库方法,一般是切胶或磁珠分选后直接连接接头 (sequential RNA ligation,通常构建出来都是链特异性文库)。

二、消化 rRNA

如果想获取到不含 polyA 的 RNA 序列,只能采用消化 rRNA 的方法,因为一次转录过程中,rRNA 占据了超过 85%的序列。该方法可以进行全转录组测序。

移除 rRNA 有两种方法,一种是将 rRNAs 从总 RNA 中分离出来(所谓的 pull-out 法),另一种是使用 RNAse H 酶降解 rRNA。这两种方法都需要使用序列特异性和物种特异性的、能与细胞质 rRNA (5S rRNA,5.8S rRNA,18S rRNA 和28S rRNA)和线粒体 rRNA (12S rRNA 和 16S rRNA)互补的寡核苷酸探针。

最近的比较表明,在 RNA 质量高的前提下,这种方法都可以将产出数据中 rRNA的比例降低至 20%以下。但是,研究还表示 RNase H 方法比 pull-out 法的稳定性要好。

三、链特异性

链特异性转录组测序(strand-specific RNA-seq)是指转录组测序过程中文库构建采用的链特异性建库方式。此建库方式可以保留转录组测序时转录本的方向信息,即可以确定转录本是来源于基因组上面的正义链还是反义链。

目前构建链特异性文库的方法有多种,其中用的最普遍的即是 dUTP 方法。主要是在合成 cDNA 第一链的时候,用了尿嘧啶 U,在二链合成时把这条 U 链降解。后续第一链保留下来用于测序。因此,测序得到的转录本序列信息,只是来源于第一链的。测序后的数据分析可确定转录本是来自正义还是反义 DNA 链。具体建库流程如下:

链特异性文库

四、小RNA建库

五、spike-in 内参

RNA 的 spike-in 一种绝对定量的方法,在原有的 RNAseq 文库中加入已知量的RNA 转录本,目前普遍使用的是 ERCC( The External RNA Control

Consortium)。通过在样品制备过程中,混入指定数量的 spike-in,我们就可以知道不同样本中的基因绝对比表达值。

RNA-seq 常用的 spike-in 有 External RNA Controls Consortium mix (ERCCs),spike-in RNA variants (SIRVs)和 sequencing spike-ins

(Sequins)。由于 spike-in 的 RNA 浓度是预先知道的,并且浓度与产生的reads 的数量直接相关,因此可以校准样品中转录本的表达水平。

使用最多的 spike-in 是 ERCC( The External RNA Control Consortium)的spike-in MIX,有 mix1 和 mix2 两只试剂,混合有 92 种不同的 mRNA。可以直接从下面网站进行选择。

代码语言:javascript复制
https://www.nist.gov/programs-projects/external-rna-controls-consortium

六、UMI

UMI 是单分子识别码(Uniquemolecular identifier)的简称,一般是 10-12bp。UMIs 被认为是一个处理扩增偏好性的方法。在 cDNA 分子扩增前加入随机 UMIs 可以用于识别并计算移除 PCR 引入的重复,而不影响到基因自身表达引入的重复,进而改善基因表达定量的结果和评估等位基因的转录。如果一对测序 reads 包含有相同的 UMI 并且比对到转录组的同样位置,则被认为是技术引入的重复 。

10x whitelist

UMIs 已经被证明能够通过降低检测到的基因表达变化波动和假阳性率改善 RNA-seq 差异基因的统计分析。因为单细胞数据的扩增偏好更严重,UMI 的使用对单细胞数据结果可靠性至关重要。当使用 RNA-seq 数据进行变异检测 (variant calling)时,UMIs 也非常有用。高表达的转录本更容易达到适合变异检测的高覆盖率要求,尤其在考虑了重复 reads 时,而 UMIs 可用于移除 PCR 扩增引入的reads,从而校正等位基因频率的计算。UMIs 已成为单细胞 RNA-seq (scRNA-seq)的文库制备试剂盒的标配,也越来越多的用于常规 RNA-seq。

写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。

代码语言:javascript复制
bioinfoer.com

有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。

0 人点赞