一、单细胞测序简介
细胞(cell)是生物体基本的结构和功能单位。除病毒之外的所有生物均由细胞所组成。一般来说生物体所有细胞中包含相同的遗传物质 DNA,但会进行不同的转录表达,最终分化为不同的细胞。这些细胞相互作用并扮演不同的角色,在更大的体系中构建并驱动多个过程。传统的测序都是基于多细胞进行测序,对组织进行 DNA 或 RNA 提取,然后进行测序。
动物和植物细胞结构
单细胞测序(single cell sequencing),简称 scRNA-seq,顾名思义,就是能对单个细胞进行测序,提供了在单细胞水平观测基因表达的方法,可以更好地研究这些组织及其中存在的不同类型的细胞。将达到单细胞水平的分辨率。
二、为什么要做单细胞测序?
人类各种组织之间细胞的类型,状态和相互作用差异巨大。而单细胞RNA测序(scRNA-seq)技术提供了单细胞水平的分辨率,在单细胞水平观测基因表达的方法,可以更好地研究这些组织及其中存在的不同类型的细胞。
以小鼠心脏组织为例,可能直觉上,你认为心脏主要是一团会跳动的肌肉,主要是心肌细胞(Cardiomyocytes)。但如果进行单细胞检测(图 2,可以看出心脏的细胞构成实际上非常丰富,不仅有心肌细胞,还包括成纤维细胞(Fibroblasts)、内皮细胞(Endothelial cells)、血管内皮细胞(Vessel Endothelial)、心外膜细胞(Epicardial)、巨噬细胞(Macrophages)、淋巴细胞(Lymphocytes)、平滑肌细胞(Smooth muscle)等,而成纤维细胞则又可以进一步分为若干个子亚群。
小鼠心脏中的细胞类型(左)以及成纤维细胞可以进一步分为若干子亚群(右)
单细胞转录组可以很好地解决细小组织的划分问题以及细胞异质性问题。
1 研究一个组织中到底存在哪些种类的细胞
2 识别未知或少见的细胞类型或状态
3 阐明在分化过程或时间及状态变化中基因表达的改变
4 找出在不同条件下(如加药组和疾病组)在某一特定类型的细胞中差异表达的基因
5 探究一种细胞类型之间基因表达的变化,同时纳入空间,调控和/或蛋白质信息
三、bulk RNAseq 与单细胞 RNAseq
在单细胞 RNA 测序(scRNA-seq)出现之前,转录组分析是使用批量 RNA 测序(bulk RNA-seq)进行的,虽然 RNA 测序(RNA-seq)或芯片分析等大量样本的转录组学方法是一类强大的工具,也可以筛选得到差异表达的基因,但是这是一种比较细胞基因表达平均值 (averages of cellular expression)的方法。很多情况下同一组织中不同细胞的基因表达量是不同的,有可能差别非常大,尤其是肿瘤组织中。如下图所示:
从大量细胞到单细胞基因表达,分辨率在不断提高。
左图显示了样本的大量细胞转录图谱,其中包含 6 个基因的平均表达水平。右图代表了单细胞基因表达数据,揭示了样本真实的细胞异质性,以及在平均视图中看到的表达模式的细胞来源。
常规 bulk 转录组检测的是样本中所有细胞的均值,而我们研究目标(例如,某种疾病的发生机制)却可能只与其中的某种细胞相关。例如,如果研究心脏纤维变性,最佳方案应该只针对心脏成纤维细胞进行检测和比较,而普通转录组往往是检测整个心脏组织。如果我们研究胰腺的胰岛素分泌变化,那么理论上应该针对胰岛α细胞进行检测比较,而普通转录组可能是对整个胰腺进行检测。
bulk RNAseq 与 scRNAseq
同样在做肿瘤基因表达研究中,癌细胞可能只占其中很小的比例,这个时候癌细胞真实的表达情况被周围正常细胞基因表达给“平均”掉了,利用传统 bulk 无法筛选到真实差异表达的基因。
同一肿瘤组织中不同的细胞类型
通过单细胞测序技术,使得科学家能够定义细胞类型特异的基因表达,从过去的平均数据中分辨出真正驱动其表达模式的细胞异质性(图 3。这让研究人员能够更全面地表征组织异质性,鉴定稀有细胞类型,并逐个细胞地仔细分析其分子机制。当获得了对其研究的生物系统更为真实的图谱后,研究人员就有了更为坚实可靠的知识基础,并能在这个基础上规划下一步实验,以获取更深入的可行动见解。
虽然单细胞转录组可以提供更高分辨率,但样本制备和建库成本更高,测序数据量更大,成本也更高,分析难度也更大。
四、单细胞测序的应用
4.1 单细胞转录组学
单细胞转录组学,single cell RNAseq,简称 scRNAseq,是单细胞测序领域第一个也是最基础的应用。通过单细胞 RNA 测序来分析全转录组或靶向基因表达,对细胞进行大规模的分子和细胞鉴定。
单细胞基因表达能够提供单细胞转录组 3'基因表达和多组学功能,可同时对成千上万个细胞进行分析。通过结合单细胞水平的基因表达、细胞表面蛋白表达或 CRISPR 编辑,可以探索细胞异质性,鉴定新的靶点及生物标志物。
通过单细胞转录组测序对细胞进行分类
4.2 单细胞免疫分析
单细胞免疫分析解决方案带来了一种综合的方法,能够以单细胞分辨率同时研究免疫系统的细胞异质性、T 细胞和 B 细胞组库多样性以及抗原特异性。既可以通过全转录组分析发现新的细胞类型和状态,又可以采用感兴趣的靶向基因表达基因组合来重点搜索。有了这些最新的改进,单细胞免疫分析 v2 大大提高了灵敏度,能够实现稀有细 胞群体和稀有表型的检测。大规模和高分辨率的全面免疫表型分析从未变得如此触手可及。
通过 5' 基因表达同时分析细胞表面蛋白表达和抗原特异性。
目前的单细胞免疫分析包括:
1、免疫组库分析
2、细胞表面蛋白
3、抗原特异性
4、CRISPR Screening
4.2.1 单细胞免疫组库(V(D)J-seq)
单细胞免疫组库,是 10X genomics 推出的第二个单细胞产品。免疫细胞包括 B 淋巴细胞、T 淋巴细胞、自然杀伤细胞和树突状细胞等,其中 T、B 淋巴细胞为机体最重要的免疫细胞,能根据不同的抗原结构产生不同的抗体来对抗病原体(抗原)的入侵,其数量及功能的改变反映机体免疫能力。
抗原的识别依赖于 B 细胞表面受体(B cell receptor ,BCR)和 T 细胞表面受体(T cell receptor,TCR)。TCR/BCR 按照保守程度分为可变区(Variable regions, V 区)和恒定区(Constant regions,C 区),V 区又由 variable (V), diversity (D), joining (J)三类基因片段重组连接构成,且 V/D/J 这 3 类基因片段都有大量冗余的的片段,因此可以通过重组产生丰富的 TCR/BCR序列组合。
免疫组库分析
通过在单细胞水平捕获全长、配对的 B 细胞和 T 细胞受体,了解克隆扩增和多样性。
4.2.2 细胞表面蛋白
某些高度相似的细胞在转录水平可能无法清晰划分,但在蛋白水平则可能有更好的分类效果。Feature Barcode 技术以单细胞分辨率测定多达数百个细胞表面蛋白。将基因表达分析与单细胞水平的免疫表型相关联,从而更好地描绘免疫细胞亚群和功能状态。
细胞表面蛋白
细胞表面蛋白测序辅助细胞亚群分类
4.2.3 抗原特异性
在单细胞分辨率下评估适应性免疫系统的特异性,同时捕获成对的 T 细胞受体和肽-MHC多聚体,或免疫球蛋白重链和轻链及其同源抗原。
抗原特异性
4.2.4 CRISPR Screening
对于数万个细胞中的数百个基因,以单细胞分辨率将 CRISPR 编辑与基因表达表型直接关联,探究疾病通路并阐明分化和发育的驱动因素。
更多内容:https://www.10xgenomics.com/cn/p ... ll-immune-profiling
4.3 单细胞 ATAC-seq
染色质开放区:大多数基因组中的染色质都紧紧盘绕在细胞核内,但也有一些区域经染色质重塑后呈现出松散的状态,这部分无核小体的裸露 DNA 区域被称为开放染色质(open chromatin),而 DNA 复制和基因转录都发生在这些区域。
染色质的这种特性叫做染色质的可接近性(chromatin accessibility),通过研究细胞特定状态下开放的染色质区域可以在 DNA 水平上了解其转录调控,ATAC-seq 就应用于此。
ATAC-seq(Assay for Transposase Accessible Chromatin with high-throughput sequencing,染色质易开放区域测序)利用 Tn5 转座酶切割染色质的开放区域,并加上测序引物进行高通量测序,通过生物信息分析鉴定转录因子结合位点和核小体区域位置,从而为研究基因调控、DNA 印记等提供有效的方法。
ATAC-seq 示意图
更多内容:https://www.10xgenomics.com/cn/products/single-cell-atac
4.4 空间转录组
Visium 空间基因表达流程实现了全转录组分析(新鲜冷冻组织和 FFPE 组织)和靶向分析(新鲜冷冻组织),同时保留了空间信息。它在组织结构、组织微环境和细胞群体的背景下提供了基因表达数据。
空间转录组
空间捕获技术 Visium 空间基因表达分析使用 Visium 玻片,每块玻片有二到四个捕获区域。每个捕获区域含有约 5,000 个捕获数据点,而每个数据点又包含数百万条带有以下特征的寡核苷酸:一段 30 个核苷酸的 poly dT 序列,可捕获聚腺苷化的 mRNA 分子;一段 12 个核苷酸的特异性分子标签(UMI),可识别在文库制备和测序过程中出现的重复分子;一段 16 个核苷酸的空间条形码,由单个基因表达数据点中的所有寡核苷酸共享;以及一段部分的 TruSeq Read 1 序列,用于流程中的文库制备和测序。
更多信息:https://www.10xgenomics.com/cn/products/spatial-gene-expression
4.5 单细胞多组学在肿瘤研究中应用
1、肿瘤微环境
发现组织结构对癌症进展、免疫浸润和治疗应答的影响,鉴定驱动多种表型和发育轨迹的表观遗传调控因子和转录程序。
2、肿瘤异质性
构建整合的单细胞和空间图谱,揭示肿瘤内异质性,并追踪肿瘤内和跨癌种克隆进化的转录组和表观遗传调控因子。
3、免疫肿瘤学
表征肿瘤进展中的免疫细胞调节,推动免疫疗法。确定介导抗肿瘤应答的浸润和外周免疫细胞的受体库。
4、疗法开发
发现新的治疗靶点,探索各种疗法如何调控肿瘤微环境中的细胞群体和状态,并了解受转录组和表观遗传重塑控制的耐药机制。
4.6 免疫学的主要研究领域
1、传染病和疗法开发
了解病原体如何感染宿主细胞并引发免疫反应。将宿主的免疫反应与疾病复原或严重程度关联起来。生成靶向的免疫疗法。
2、疫苗
确定适应性免疫细胞的受体库和抗原特异性。推进疫苗开发并确定预防性抗体。
3、免疫肿瘤学
鉴定肿瘤微环境中的浸润免疫细胞。表征免疫细胞功能和受体库。
4、自身免疫
破译方向错误的免疫反应的潜在机制。在单细胞和器官系统中探索疾病的病理生理学。
5、过敏和炎症
研究先天性和适应性免疫激活的生物学机制。破译因人体受伤而引起的免疫过度活化的机制。
6、移植
推进实体器官和血液干细胞移植的临床管理。了解移植疾病的免疫学基础。
7、细胞和分子免疫学
探索健康和疾病状态下免疫系统的基本生物学。鉴定人体内的免疫细胞身份、功能和组织。
4.7 利用单细胞多组学重塑神经科学
1、神经退行性疾病
从多个维度构建一幅有关神经退行性疾病的复杂生物学的完整图像。加深您对病理特征如何影响周围微环境的理解,以及细胞对发病机制和疾病进展有何贡献的理解。
2、精神疾病
采用单细胞和空间技术来探索精神疾病的分子基础。表征与疾病相关的细胞表型,并发现新的病理学影响。探索神经细胞的调控网络,并鉴定各种细胞类型和状态的表观遗传调控因子。
3、发育神经科学
获得一幅比以往更详细的神经发育和分化图像。解析控制细胞分化的分子通路,鉴定新的细胞亚型标志物,并揭示控制细胞分化的动态基因表达模式和调控网络。
五、单细胞测序发展历史
单细胞测序目前一般采用二代 illumina 高通量测序。整个流程的核心在于获取单细胞,得到单细胞之后提取 mRNA,反转录成 cDNA 在测序,这些步骤与常规测序基本一致。因此如何进行单细胞的捕获分选是最重要的,也是不同单细胞平台的差别。
单细胞测序的发展历史主要就是不同单细胞捕获分选的历史。
单细胞捕获分选发展历史
下图中单细胞捕获分选方法的发展历史,也是单细胞测序技术的发展过程,下面我们以时间轴顺序介绍一下几种典型的单细胞测序发展历史。
单细胞测序发展历史
2009 年:北大汤富酬发表文章单细胞测序文章,使得单细胞研究成为可能,被称为单细胞测序元年;
2010 年:浙大郭国冀发表文章揭示对 500 多细胞进行 48 个基因的单细胞 RT-qPCR 就可以进行细胞类型区分,使得单细胞测序方向转向大量细胞低深度测序;
2011 年:STRT-seq( Single-cell tagged reverse transcription ) 测序技术诞生。
2012 年:单细胞全长转录组测序技术 SMART-Seq;
2013 年:微流控系统分离细胞 Fluidigm C1,一次最多可以捕获 96 个单细胞;
2015 年:纳米液滴系统-油包水分离细胞 Drop-seq;
2015 年:蜂窝板捕获 Cyto-seq 技术;
2016 年:10x genomics 单细胞转录组测序,开启大规模高通量单细胞测序时代;
2017 年:BD Rhapsody 平台推出,基于蜂窝板捕获 Cyto-seq 技术;
2017 年:单细胞组合索引: sci-RNA-seq,通量继续提高到 50000 单细胞;
2017 年:10x genomics 单细胞免疫组库 VDJ 测序;
2018 年:10x genomics Feature barcode 技术用于检测细胞表面蛋白;
2018 年:郭国骥推出微空系统 Microwell-seq,检测通量 40 万;
2018 年:10x genomics 单细胞 ATAC-seq;
2019 年:10x genomics 单细胞空间转录组;
六、重要单细胞研究计划
6.1 人类细胞图谱(Human Cell Atlas)计划
人类细胞图谱(Human Cell Atlas)计划是一项与“人类基因组计划”相媲美的大型国际合作项目(比如华大基因、扎克伯克、南方科技大学等名企名人名校都参加在内),致力于建立一个健康人体所包含的所有细胞的参考图谱,包括细胞类型、数目、位置、相互关联与分子组分等,旨在全面解码人体所有细胞的类型、数目、位置、相互关联与分子组成等,构建细胞基因表达等高维数学特性的精细图谱,建成人体发育、生理、病例的完善和精细的参照系,最终建立全息生命信息网络。这项计划目前已经得到了不同类型的图谱。已收录 33 个组织、289 位供体、450,0000 个单细胞的测序数据,并在持续更新中。如果说分子作图可以产生某种细胞类型的转录本、蛋白质或表观遗传学表达谱,功能和形态学作图将这些表达谱与细胞行为及外观链接了起来,而空间作图则将细胞定位于某个组织或器官之内。在这几个方面和层次上建立起来的人类细胞图谱计划,汇编了一套人类细胞的参考数据集。这对于生信研究无疑提供了一个大型、权威的单细胞测序数据来源。
长远来说,人类细胞图谱计划,HCA 旨在描述人体中每个细胞(约 37 万亿个)的详细特征,呈现不同类型细胞在人体组织的 3D 结构,勾勒所有人体系统的相互联系,揭示图谱变化与健康和疾病的关系。人类细胞图谱计划将彻底改善人们对疾病的理解、诊断和治疗。
网址:https://data.humancellatlas.org/
6.2 其他重要研究计划
Single Cell Expression Atlas:https://www.ebi.ac.uk/gxa/sc/home
human tumor atlas:https://humantumoratlas.org/
Human Cell Landscape:http://bis.zju.edu.cn/HCL/
Mouse Cell Atlas:http://bis.zju.edu.cn/MCA/#
Tabula Muris:https://tabula-muris.ds.czbiohub.org/
Fly Cell Atlas :https://flycellatlas.org/
Cell Atlas of Worm :https://atlas.gs.washington.edu/worm-rna/
Arabidopsis Root Atlas :https://bioit3.irc.ugent.be/plant-sc-atlas/root
写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。
代码语言:javascript复制sx.voiceclouds.cn
有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。