单细胞测序原理

2022-10-25 19:35:57 浏览数 (2)

一、细胞捕获分选技术

1.1 细胞分选技术

单细胞测序主要包括以下四个步骤。其中非常关键的一点就是如何进行单细胞的捕获/分选,这是决定单细胞检测成本和通量的关键步骤。

单细胞测序分析流程图

不同单细胞测序平台主要差别也主要在于单细胞捕获分选的方法不同。在细胞分选的方法里,主要包括特异性分选和非特意性分选两类方法。

所谓特异性是指可以直接选取到目标细胞进行检测,而非特异性选择则是随机进行捕获。这两种方法类似于用 PCR 扩增目标基因还是高通量测序。因此,特异性选择一般意味着低通量,只能进行少量单细胞测序,而非特异性选择则可以进行高通量测序。

特异性细胞选择是从目标组织/样本中,用特定标志(例如:荧光标记物或细胞形态)对特定目标细胞进行挑选,然后对目标细胞开展测序。所以特异性选择的方法通常通量很低。

非特异性选择的方法则通常都是高通量的方法,一般是用特定的技术随机从样本中(通常为单细胞悬液)捕获的大量细胞单体,然后直接平行对大量细胞进行独立的测序,再从大量单细胞数据中寻找自己感兴趣的细胞类型进行后续分析。

单细胞捕获分选方法(来自文章PMID:30089861)

上图中列出了几种不同的单细胞捕获方法。分别为:

a:微吸管分离

b:显微镜辅助毛细管捕获

c:荧光标记细胞分选(FACS)

d:激光捕获显微分离(LCM)

e:微流控

f:抗体磁珠分选(MACS)

g:微液滴

以上几种技可以分为按照特异性选择与非特异性选择进行分类:其中特异性选择包括微吸管分离,激光捕获显微分离,荧光标记分选,激光捕获显微分离,抗体磁珠分选几种方法。非特异性选择包括微流控,微液滴以及微孔。

下表中根据选择类型,样品要求以及分选细胞数目对几种技术进行了比较。

几种常见单细胞分选技术比较

技术

微吸管分离

激光捕获显微分离

荧光激活细胞分选

抗体磁珠分选

微流控分选

微液滴分选

微孔分选

选择类型

特异性选择

特异性选择

特异性选择

特异性选择

非特异性选择

非特异性选择

非特异性选择

样本要求

任何组织

任何组织

单细胞悬液

单细胞悬液

单细胞悬液

单细胞悬液

单细胞悬液

一次分选的细胞数

少量细胞

少量细胞

数百~上千个细胞

不受限

数百个细胞

数千个细胞

数千个细胞

1.2 非特异性分选类技术

特异性分选细胞往往捕获细胞数较少,操作复杂,不适合大规模操作,且手工操作步骤较多,对技术人员有较高的要求,重复性不好。而非特异性分选细胞技术一次可以捕获数千个细胞,目前主要有三大平台,分别是微流控芯片,微孔技术以及微液滴的方法。下面分别来介绍三种方法。

三种非特异性高通量单细胞平台

技术类型

代表性技术

技术原型

微流控芯片

Fluidigm 的 C1 平台

Fluidigm 微流控技术

微液滴

10X genomics 单细胞平台

DROP-seq

微孔(蜂窝板)技术

BD Rhapsody 平台

Cyto-seq

1、微流控平台

微流控代表性的技术是 Fluidigm 公司的微流控芯片 Fluidigm C1。Fluidigm C1 芯片就像一个电路,单细胞悬液导入后,单个细胞会被引入独立的腔室。一张芯片有 96 个腔室,所以一次最多允许 96 个细胞平行独立进行裂解、反转录和 PCR 扩增。

Fluidigm C1 平台

反转录扩增过程中,每个细胞的 cDNA 会被接上特异的接头序列,保证后续混合测序后还能重新独立拆分每个细胞的数据。Fluidigm C1 芯片由于可以平行进行 96 个细胞的建库测序,所以相比 SMART-seq 类的技术,已经大大降低了成本。

但如果进行目标组织细胞图谱全景扫描这样的研究,一般要求检测至少数千个甚至几十万个细胞。而 Fluidigm C1 芯片通量只有 96 个细胞,则意味着要进行多次芯片捕获,这会大大提高芯片耗材的投入成本。因此,我们还需要更高通量的技术。

官网:https://www.fluidigm.com.cn/

2、微液滴

微液滴的代表产品是 10 x genomics 单细胞测序系统,该系统是基于 drop-seq 原理。首先是将单独的细胞和一个包含建库所需酶的珠粒(bead)包裹在一个纳米级液滴里面。每个珠粒(bead)包含一段独特的条形码序列(barcode),会加到所有来自于液滴里面这个细胞的序列上,用于区分不同细胞的转录本。由于使用液体的模式,不受空间的限制,可以极大地提高细胞捕获量,目前一张芯片可以检测的细胞数在 3000-8000 个之间。10X genomics 是目前主流的单细胞测序平台,下面章节我们将详细介绍 10X 单细胞测序原理。

drop-seq 测序技术

3、微孔技术

微孔技术的代表产品是美国 BD(Becton,Dickinson and Company)公司的 BD Rhapsody 平台。BD Rhapsody 技术原型是 2015 年出现的 Cyto-seq,与 10X genomics 是同时代的技术。

BD 的技术不再采用利用 DROP-seq 微液滴技术进行单细胞分离和捕获,转而采用 Cyto-seqa特有的蜂窝板技术。该技术的实验过程是先让单细胞悬液流过蜂窝板(蜂窝板上有 20 万 的微孔,数量同样远大于投入的细胞数量),让细胞落入微孔中。通过控制导入的细胞数,让细胞数远小于微孔数,从而减少两个细胞落入一个微孔的现象(形成多胞体)。

等细胞分别落入微孔后,再在蜂窝板上铺上微磁珠。最终在微孔中也会形成“磁珠-细胞-反应试剂”的体系,完成单个细胞的相关反应(例如转录组测序的细胞裂解、转录组、扩增等过程)。实际上,BDRhapsody 和 10genomics 的区别主要就在用不同的体系承载单细胞的分选(前者是蜂窝板,后者是微液滴),其他后续的建库、测序、分析则几乎完全相同。

BD Rhapsody 单细胞多组学分析系统包括:

BD Rhapsody™ 扫描仪

BD Rhapsody™ 上样台

BD Rhapsody™ cartridge (微孔板)

分子标签试剂和文库制备

全转录组检测试剂盒/靶向 RNA 检测试剂盒/定制试剂盒

Abseq 蛋白检测试剂盒

多样本混样检测试剂盒

VDJ 检测试剂盒

单细胞测序数据分析软件 BD SeqGeq

官网:

https://www.bdbiosciences.com/en ... cs-systems/rhapsody

BD Rhapsody 单细胞多组学分析系统

二、10x 单细胞测序技术

10x genomic 公司于 2016 年 2 月推出 10x Chromium Single Cell Gene Expression Solution,此平台整合了仪器、试剂盒和信息学软件,能全面对接 illumina 测序仪,因此可实现大量大细胞的快速高效标记、测序和分析,获得单细胞水平的基因表达谱和差异情况,并通过对复杂细胞群体进行深入细致分析,绘制大规模单细胞表达图谱。

在介绍10x genomics单细胞测序之前,我们先介绍一下10 x genomics单细胞几个核心元素。

2.1 GEM

GEM 和 10x 单细胞测序的核心,GEM 是 Gel bead inemulsion 的简称,首先介绍 Gel bead(凝胶磁珠)。Gel bea 由凝胶珠和磁珠上的一段引物构成,引物序列构成依次为:全长Illumina TruSeq Read 1 测序引物、16nt 10X Barcode 序列(每个 Gel bead 的 10X Barcode均不相同,形成 GEM(Gel Beads-in-emulsion)后用于区分细胞)、12 nt unique molecular identifier (UMI) (区分同一细胞的不同转录本并去除 PCR Duplications,实现绝对定量)、30 nt poly dT 反转录引物。

Gel bead 结构

GEM 单细胞捕获

一个油滴 (GEM)=一个单细胞 一个凝胶微珠=一个 scRNA-Seq,可以说这就是 10X 的基本技术原理。

2.2 Barcode

barcode 是一段 14-16bp 的标签序列,每一个 GEM 中包含一种不同的 barcode,每次反应投入约 75 万个 GEMs,也就是 75 万种 barcode,远远大于细胞数目。通过不同的 barcode标记不同的细胞。最终测序出多少个 barcode 序列,就有多少个细胞,一张 10x genomics芯片一般控制在 3000-8000 个细胞。最终表达矩阵中每个细胞的名字用 barcode 表示。由于 barcode 和细胞之间的关系,有时候也称为 cell barcode,简称 CB。

细胞捕获完成之后,会将所有的细胞破裂,所有序列进行统一测序,测序完成之后根据barcode 序列进行拆分。同一 barcode 序列来自同一细胞。10x genomics 单细胞的 barcode与 illumina 测序的 index,纳米孔测序的 barcode 类似,只不过前面二者用于区分不同样品,每次测序样品不会太多,因此很短的 index(8bp),barcode(12bp)即可区分。单细胞数据较多,相应的 barcode 长度也更长。

利用 barcode 拆分细胞

10x genomics 芯片同时可以上样 8 个文库,不同文库可以使用相同的 barcode,为了保证整合多个文库时barcode不发生冲突,通常会在barcode后面加一个数字,标记其来源的文库,因此有时候会在结果中看到如 AGACCATTGAGACTTA-1 和 AGACCATTGAGACTTA-2,barcode 序列一样,但来源于不同的文库,也是不同的细胞。

2.3 UMI

UMI 是单分子识别码(Uniquemolecular identifier)的简称,一般是 10-12bp。UMIs 被认为是一个处理扩增偏好性的方法。在 cDNA 分子扩增前加入随机 UMIs 可以用于识别并计算移除 PCR 引入的重复,而不影响到基因自身表达引入的重复,进而改善基因表达定量的结果和评估等位基因的转录。如果一对测序 reads 包含有相同的 UMI 并且比对到转录组的同样位置,则被认为是技术引入的重复 。

UMI 的主要作用就是为了避免扩增产生的重复,这种重复会对后续基因表达定量造成差别,传统 RNAseq 中也可以使用 umi 分子,但是用的并不多,这是因为传统 RNAseq 测序数据量足够大,比如一次测序 2000 万 reads,即使有部分 PCR 带来的偏差影响可以接受。但单细胞测序中每个细胞只测序约 2 万条 reads,这个时候 PCR 扩增带来的偏差就有较大的影响,因此在单细胞测序中,通常需要使用 umi 分子标记。

测序完成之后按照 barcode 进行拆分细胞,相同 umi 计数时会进行合并

2.4 GEM 与 Barcode 以及 Umi 之间的关系

上面介绍了 10x genomics 单细胞测序中最重要的三个元素,GEM,barcode 与 umi。

理解了这三个概念就理解了 10x genomics 单细胞测序的原理。

1、GEM 是一个反应体系,在开始之前里面已经加好了 barcode 与 UMI;

2、不同 GEM 中包含不同 barcode;

3、一个 GEM 中具有相同 barcode,不同的 umi;

4、不同 GEM 中具有不同 barcode,相同的 umi;

5、barcode 代表细胞;

6、umi 代表测序 reads,也可以认为是 gene;

三、10X genomics 单细胞测序文库构建及测序

3.1 文库构建

下面是 10x genomics 单细胞测序文库构建的官方示意图,在单细胞悬液制备完成之后,就可以开始进行文库构建了。

首先将样本制备成单细胞悬液,随后进行上机前细胞计数和细胞活率检测,若细胞活率≥80%,则将细胞浓度调整为 700-1200 个/μL。将制备好的细胞悬浮液利用微流控芯片,将带有细胞标签序列(cell Barcode)的凝胶珠(bead)和细胞包裹在液滴中。在液滴中,细胞破裂,释放的 mRNA 与凝胶珠上的细胞标签序列相连,形成单细胞 GEMs 结构(Gel Bead in Emulsions)。细胞的 mRNA 在液滴中进行逆转录反应形成 cDNA,随后破乳,进行 cDNA 的文库构建。通过文库序列上的细胞标签序列可以区分目标序列来自于哪一个细胞。

文库构建主要分为 5 个步骤。

步骤 1:准备好 10X 官方提供的微磁珠。这些磁珠上都连接着后续反转录所需的接头、barcode、UMI 等序列。

10x genomics 单细胞文库构建

步骤 2:磁珠进入 10X genomics 芯片。磁珠在可以管道中流动(这里管道中是水),会经过两个“十字路口”。

10x genomics 单细胞芯片

在第一个“十字路口”与另外一个管道交叉。新加入的管道里流动是细胞和反转录扩增所需的试剂。经过这个“十字路口后”,一部分磁珠就吸附上了细胞,且整个液体环境富含后续反应所需的酶。

第一个十字路口为细胞,第二为油滴

在第二个“十字路口”,新加入的管道里流动的是油。油和水混合,就会形成乳浊液(油包裹水滴的环境)。由于磁珠是亲水的,所以一个个磁珠以及其吸附的细胞就就被包裹在水滴里。

步骤 3:在这些油包裹的水滴里,将完成细胞裂解、反转录、扩增等步骤。

步骤 4:每个细胞的 cDNA 完成扩增,并携带这独一无二的接头,等待进行后续测序。

基于这样的步骤,通过合理控制每次输入的细胞数,最终一张 10X genomics 芯片可以检测的细胞数一般控制在 3000~8000 个之间。而且因为检测的细胞数巨大,几乎保证每类细胞至少几十个甚至成百上千个重复。那么每个细胞检测的数据量大概只要 5 万条左右的 reads就足够了。

步骤 5:上机测序

利用Illumina测序平台的PE150测序模式对建好的文库进行高通量测序。最终得到测序结果。

一个完整的文库包括:

reads 1 :barcode 与 umi 序列,v2 试剂读长 26bp,v3 试剂 28bp

reads 2 :转录本序列,v2 试剂读长 98bp,v3 试剂 91bp

3.2 10x genomics 单细胞测序平台优势

1.真正单细胞测序

10x genomics技术原理类似于Drop-seq,平台利用微流体“双十字”交叉系统分选单个细胞,通过 barcode 磁珠-单细胞-油滴的对应关系形成 GEM(Gel Beads-in-emulsion),实现真正意义上的单细胞测序。

2.超高细胞通量

微流体“双十字”交叉系统为 8 通道系统,每个通道最高可捕获 10000 细胞,8 通道一次可检测细胞范围为 500-80000 个细胞。

3.细胞捕获效率高

单个细胞捕获效率高达 65%,可准确鉴别稀有细胞类型,利于稀有样本或小细胞量类型样本研究。

4.细胞可适性高

对细胞大小(直径超过 40um 细胞需要制备成细胞核)及类型无限制。

5.多态率低(Multiplet Rate)

多态率(同一个 GEM 包含 2 个及 2 个以上细胞)低于 0.9%/1000 细胞。

6.时间周期短

自动分离,无需人工操作,1 天内可完成从细胞悬液到 cDNA 文库构建的所有的测序准备工作。

7.性价比高

单个细胞成本低于其他单细胞平台。

3.3 总结

1、文库构建时有很多种类的 GEMs

2、通过合理控制每次输入的细胞数,来最终控制检测的细胞数;目前均可以检测3000-8000 个细胞;

3、一般来说,约有 65%的 GEM 在 10X 芯片的管道中可以成功捕获细胞,但也有 35%没有捕获细胞,称为空载;

4、空载的 GEM 并非没有任何结果。由于单细胞悬液中存在细胞破裂产生的游离 RNA,因此空载 GEM 中也会扩增得到少量 RNA 的信息,但基因数会很少。

5、有部分 GEM 中会包含两个细胞称为 doublets,超过两个称为 multiplets。

6、最终要将空载或者过载的非单细胞过滤掉。

写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。

代码语言:javascript复制
sx.voiceclouds.cn

有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。

0 人点赞