【生信文献200篇】10 单细胞转录组探索小鼠肝脏发育

2021-02-03 16:34:54 浏览数 (1)

00 文章信息

「英文标题:Single-cell spatial reconstruction reveals global division of labor in the mammalian liver」

「中文标题:单细胞空间重建揭示哺乳动物肝脏的全局分布」

「期刊:」《Nature》

「影响因子:」 42.778 「发表时间:」 2017 Feb 16

「研究领域:」 单细胞转录组学

「DOI号:」 10.1038/nature21065

01 文献概述

Summary

liver zonation 的空间分辨单细胞重建策略。

(a)用smFISH测定区带标记(LM)基因的空间位置(b)scRNA-seq提供数以千计的小鼠肝细胞的转录组

(c)空间位置用于推断每个细胞中心坐标

(d)这些坐标被用来重建所有肝脏基因的空间分带轮廓

02 文章背景

  • 肝脏是由肝细胞组成的异质组织,肝细胞在称为小叶的重复解剖单位中运作。六角形的小叶由大约15层同心的肝细胞组成。血液从小叶角落的门静脉和肝动脉流向引流的中心静脉,产生氧气、营养和激素的梯度。此外,从中央静脉分泌的Wnt形态因子会产生反向偏振场。根据这种分级的微环境,不同的放射状层次在不同的过程中进行亚特化,这种现象被称为“肝区带”。这种空间分工被认为是肝功能的最佳选择
  • liver zonation 的全基因组重建需要一种技术来测量整个转录组和许多肝细胞的小叶坐标。单细胞RNA测序(scRNAseq)使测量的数千细胞的全基因组表达模式,但是这种技术需要组织离解,从而失去每个单元的空间位置。而将scRNAseq与空间位置基因的原位表达测量相结合可以推断原始组织坐标。我们以前已经应用了单分子荧光原位杂交(smFISH)来测量完整小鼠肝脏中肝细胞的mRNA含量。该技术具有灵敏度和动态范围,可测量不同小叶坐标下的精确mRNA分布。因此,我们将smFISH与scRNAseq结合使用以实现全基因组肝区带重建

03 实验数据

重点分析得到了3496个zonated genes

统计检验表明,在「全部的7227个肝脏表达基因」里面,有3496可以被定义为 zonated genes ,远超预期。它们对应着 肝小叶的外层到内层。

  • 在Apc-KO小鼠表达显著下降的基因有 中心周围的 pericentral 倾向 (810 of our 3,496 zonated genes)大多数集中在肝小叶的第一层
  • 在Apc-KO小鼠表达显著下降的基因有 门静脉周的 periportal 倾向 (193 of our 3,496) 大多数集中在肝小叶的第六层
  • 近三分之二的(2,314 out of 3,496 genes) were not predicted targets of either Wnt, hypoxia, Ras signalling or pituitary hormones

还利用了几个公共数据:

  • GSE3129
  • GSE49707
  • GSE68806
  • GSE84498

04 实验结果

六个高度表达的肝基因,具有不同的分区模式:中心周围基因Glul和Cyp2e1和门脉周围基因Ass1,Asl ,Alb 和Cyp2f2

(a)smFISH显微照片呈现的这些基因的spatial barcode

(b)标志性基因的区域分布图

六个标志性基因的smFISH方法显微镜下图像

scRNA-seq的TSNE结果显示了分为库普费尔氏细胞,内皮细胞和肝细胞三个不同的群体

肝细胞标志基因:Apoa1, Glul, Acly, Asl, Cyp2e1, Cyp2f2, Ass1, Alb, Mup3, Pck1, G6pc

Kupffer细胞标志基因:Irf7, Spic, Clec4f

内皮细胞标志:Ushbp1, Myf6, Oit3, Il1a, F8, Bmp2, C1qtnf1, Mmrn2, Pcdh12, Dpp4

肝细胞的表达模式高度异质,并显示出与我们的标志性基因图谱相匹配的清晰梯度

TSNE显示标志性基因 Cyp2f2 和 CYP2E1 的相对细胞表达

尿素循环基因 Ass1 和谷氨酰胺合成酶基因 Glu1 以互斥的方式表达,证明了单细胞分离的纯度

(d):smFISH 显示 Glul (红点)和Ass1 (绿点)的拮抗表达。

CV:中央静脉;PN:门脉结节

(e):Ass1 和 Glul 在scRNA-seq数据中是互斥的。每个点是一个细胞,x轴是 Glul 在细胞总UMI中的表达,y轴是 Ass1 的表达。

ScRNA-seq数据的先验和后验概率计算来计算每个细胞属于这些层中任何一层的可能性

(a,b)六个标志性基因在两种细胞609和629的不同表达水平。水平线表示细胞每个基因观察到的UMI。每层的后验概率表明细胞609最有可能起源于门脉周围层8,而细胞629起源于中心周层1。

(c,d)从9层中的每一层观察到肝细胞的先验概率

我们的重建精确度接近6个基因的饱和度。它在很大程度上取决于我们标志性基因的区域划分程度,而仅在很小程度上取决于层内细胞之间的变异性

使用smFISH对20个具有不同特征的基因进行了验证,验证了我们重建的 zonation profiles 的准确性,并发现了预测和实测特征之间的整体对应性

(a)根据我们标志性基因的预测scRNA-seq数据(蓝色)和smFISH测量结果(红色)重建了zonation

(b)验证未用于推理算法的20个基因的重构图谱。小叶层从中央静脉(第1层)到门静脉节点(第9层)编号

重建了中心周围基因 Oat (紫色)和中心周围祖细胞标记Axin2(红色)、门脉周围尿素循环酶基因Arg1(绿色)和门脉周围祖细胞标记Sox9(蓝色)的区带图谱。

约有50%的肝基因表达是非随机空间分区的,比以前的估计值高一个数量级。我们重建的图谱概括了超过4个数量级的基因表达,包括低表达的基因

我们的重构的图中央比与先前的数据集相比中心周围和门静脉周围肝细胞的转录组相关

在Wnt过度激活的肝特异性APC-KO小鼠中表达增加的肝基因主要位于中央周围(我们3496个分区基因中的810个,中值峰值表达在第1层),而在APC-KO中下降的基因具有显著更强门脉周围偏压(我们的3496个zonated基因的193,在层6中位数表达高峰)

在慢性低氧中显示增加表达的3496个带区基因中,有95个显着偏向低氧周围中层,而在慢性低氧中则减少了45个带区基因。因此,Wnt信号和氧气是诱导中央周围区域分布的主要因素。

假设Ras信号传导可引起门周围区域分布。我们发现,与减少表达的基因相比,在Ha-ras高活化肿瘤中表达增加的基因的区域分布显着更高

垂体激素可抑制中央周围基因,这一点可以通过垂体下垂体矮小小鼠中增加的基因的中央周围特征来证明。重要的是,约三分之二的带区基因(3496个基因中的2314个)都不是Wnt,低氧,Ras信号传导或垂体激素的预测靶标,这表明它们的带区受到这些因素的组合调控或其他尚待进一步研究的因素的影响

186条KEGG途径中有25个富含分区基因。氧化磷酸化途径在氧浓度较高的门静脉周围层表达较高,构成补体和凝血级联途径的分泌蛋白也较高。更广泛地说,我们发现编码肝脏分泌蛋白的基因的mRNA存在门脉周围偏向。将需要ATP的血浆蛋白生产任务分配给门脉周围氧合良好的层可能在能量上是有效的,因为估计有20%的肝脏氧气消耗专门用于这一任务。中心附近偏向的途径包括解毒途径,如异种代谢和谷胱甘肽代谢,以及胆汁酸生物合成和蛋白酶体成分

先前描述的所有肝区带分布均在门脉中央单调增加或减少。我们的高空间分辨率使得能够识别在中间小叶层达到峰值的一类新的非单调分区分布。尽管这些基因没有明显的GO注释,它们包括关键的肝脏基因,如HAMP和HAMP2,它们编码Hepcidin,一种调节全身铁水平的分泌型肝脏激素。其他非单调基因包括IGFBP2、Mup3和Cyp8b1。这些基因的非单调表达不能用先前发现的肝脏多倍体的非单调模式来解释。

我们发现Ig F1在门静脉周围层高表达,其结合蛋白IGFBP2和Igfbp1分别在小叶中层和中心周层表达。这种空间顺序可以暴露反馈系统,其中IGFBP的产生与上游分泌的IGF水平相匹配,或者可以与IGFBP的其他非内分泌功能相关

胆汁酸生物合成的中性途径由核心序列Cyp7a1-> Hsd3b7-> Cyp8b1-> Cyp27a1组成,其空间顺序与酶联级联反应中的位置相符。虽然Cyp7a1和Hsd3b7在中央周围第1层中含量最高,但下一个酶Cyp8b1在第2-3层达到峰值。与第2层相比,第1层中Cyp8b1的含量较低可能表明中间体在第1层和第2层之间转移。或者,这表明Cyp7a1和Hsd3b7在第1层中具有其他功能,或在第2层中Cyp8b1具有其他功能。

05 问题

1. 肝脏背景知识

肝脏是一种多倍体器官,由具有一个或两个细胞核的肝细胞组成,每个细胞核含有2,4,8或更多单倍体染色体组

肝脏是人体新陈代谢最旺盛的器官,负责着各种生理反应,像一个巨大的“化工厂”。除了代谢功能之外,肝脏还负责分泌胆汁、清除身体的毒素、表达血液中主要的载体蛋白以及免疫防御。

肝细胞在功能上是异质性的,以前的研究根据代谢区带(metabolic zonation)可以将其分成两个不同的群体:肝脏门静脉周围的肝细胞和肝静脉周围的肝细胞。

「肝小叶背景知识」

肝小叶是组成肝脏结构的基本单位,呈六角轮柱状,由肝细胞、毛细胆管、肝血窦和相当于毛细淋巴管的窦周隙(狄氏间隙)组成。研究人员发现,肝小叶不同层分别执行不同的功能。具体而言可分成:肝小叶的外层负责合成葡萄糖、凝血因子以及其他各种化合物,该区域富含合成反应所需的氧元素;内层负责降解毒素及其他物质;中间层合成并分泌铁调素(hepcidin)。荧光显微镜下小鼠肝小叶结构的横截面:中间层富含信使RNA分子(白点),这些基因最终表达生成铁调素(Hepcidin)。

2.文章数据处理

「首先下载原始数据」

在 SRP078795 可以找到所有原始测序数据。

脚本如下:

代码语言:javascript复制
# nohup bash prefetch.sh srr.list &
while read id
do
echo $id
~/biosoft/sratoolkit/sratoolkit.2.8.2-1-centos_linux64/bin/prefetch $id 
done <$1

下载得到的sra文件需要转换为fastq文件

代码语言:javascript复制
2.6G Feb 27 11:16 SRR3928573.sra
2.2G Feb 27 11:18 SRR3928574.sra
2.5G Feb 27 11:20 SRR3928575.sra
2.4G Feb 27 11:22 SRR3928576.sra
2.8G Feb 27 11:24 SRR3928577.sra
2.9G Feb 27 11:26 SRR3928578.sra
2.3G Feb 27 11:28 SRR3928579.sra
2.2G Feb 27 11:31 SRR3928580.sra
1.2G Feb 27 11:32 SRR3928581.sra
1.2G Feb 27 11:34 SRR3928582.sra
1.1G Feb 27 11:35 SRR3928583.sra
1.2G Feb 27 11:36 SRR3928584.sra
1.9G Feb 27 11:37 SRR3928585.sra
1.9G Feb 27 11:39 SRR3928586.sra
2.0G Feb 27 11:40 SRR3928587.sra
2.0G Feb 27 11:42 SRR3928588.sra
2.8G Feb 27 11:44 SRR3928589.sra
2.6G Feb 27 11:46 SRR3928590.sra
2.9G Feb 27 11:48 SRR3928591.sra
1.8G Feb 27 11:50 SRR3928592.sra
1.9G Feb 27 11:52 SRR3928593.sra
2.7G Feb 27 11:54 SRR3928594.sra
2.6G Feb 27 11:55 SRR3928595.sra
2.7G Feb 27 11:57 SRR3928596.sra
1.7G Feb 27 11:59 SRR3928597.sra
1.8G Feb 27 12:01 SRR3928598.sra

转换代码如下:

代码语言:javascript复制
dump='/home/jianmingzeng/biosoft/sratoolkit/sratoolkit.2.8.2-1-centos_linux64/bin/fastq-dump'
$dump -A  $sample -O $analysis_dir  --gzip --split-3 /home/jianmingzeng/data/public/oscc/sra/$srr.sra

测序数据是有格式的:

代码语言:javascript复制
@AB911.1 NB501277:61:HTNKHBGXX:1:11101:11520:1071_0_barcode=NA-EE/A-//A//6#-/##/####-AAAC-AACACCN-CNNANNNN length=68
CATCCCCGCCGCGCGTCGCGGCGTGGGAAATGTGGCGTACGGAAGACCCACTCCCCGGCGCCGCTCGT
 AB911.1 NB501277:61:HTNKHBGXX:1:11101:11520:1071_0_barcode=NA-EE/A-//A//6#-/##/####-AAAC-AACACCN-CNNANNNN length=68
A6/AEEAAAEEEAEE/EEEEEEE/EEEE/EEE/EEAEE<AEAAEEEEEEAAEEEE/EAAEEEA6EAAA
@AB911.2 NB501277:61:HTNKHBGXX:1:11101:19199:1073_0_barcode=NA-EEEE-AA/<66#-<##6####-AAAC-CATCACN-GNNANNNN length=68
TTGGGGCATTCACAGAATCTATGGTGGTTTATGGTTGTCCCAACTGACTACAGCCCAGCCCTCTAATA
 AB911.2 NB501277:61:HTNKHBGXX:1:11101:19199:1073_0_barcode=NA-EEEE-AA/<66#-<##6####-AAAC-CATCACN-GNNANNNN length=68
EEEEEEEEEEEEEEAEEEEEEEEEEEEEEEEEEEEEEEEEEAEEEEAEEEEAEAEE/EEEEAEEAEA/
@AB911.3 NB501277:61:HTNKHBGXX:1:11101:21777:1073_0_barcode=NA-EEEA-AAA////-/##/####-AAAC-CATACCT-CNNCNNNN length=68
ATCCTTTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATA
 AB911.3 NB501277:61:HTNKHBGXX:1:11101:21777:1073_0_barcode=NA-EEEA-AAA////-/##/####-AAAC-CATACCT-CNNCNNNN length=68
//EEEEEEEEEEEEEEEEEEEE/E</EAEEAE/EEEEEEE/EA<EEE/EEE/AE/AEE/EEEEEE///

所以每条reads都包含有4bp的pool_barcode, 7bp的cell_barcode 以及 8bp的random molecular tag (RMT)

但是有两个数据,作者忘记把这些信息包含进去了,「就是 AB1032.fastq.gz 和 AB1033.fastq.gz 理论上这两个数据是无法处理的。」

代码语言:javascript复制
AB1032.fastq.gz
@AB1032.1 NB501277:76:HWNK2BGXX:1:11101:24314:1080 length=68
CAGATTCTTATTCTAGAGAATAAGAATCTGGATGTGAACTTTATTGTTCATATCCTTGATCTGAGGGT
 AB1032.1 NB501277:76:HWNK2BGXX:1:11101:24314:1080 length=68
/EEAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAEEE/AEEEE/EEEEEEEE6EEAEE<AEAEEEEEE
@AB1032.2 NB501277:76:HWNK2BGXX:1:11101:25906:1080 length=68
GTGCCAGCAGCCGCGGGACTGCCAGCTCCAAGAGCGGAGATTCACGGTGCTGCCGGTACCACGCTCGG
 AB1032.2 NB501277:76:HWNK2BGXX:1:11101:25906:1080 length=68
6EEEE/EEEEEEEE<<//6</EE/EEAA/<E/AEEE/E//A//</E//EE6EE/E//A//6/EEAEE/
AB1033.fastq.gz
@AB1033.1 NB501277:76:HWNK2BGXX:1:11101:21812:1081 length=68
GTAAGCAAAAAAAAAAAAAAAAAAAAAAAAAAAGCCCAGGCCCCGCGGGTCGCCGCGGCGCGCGGGGG
 AB1033.1 NB501277:76:HWNK2BGXX:1:11101:21812:1081 length=68
EEE6EA/AEEEEEEEEEE6EEEE/EE/EE/E///////////EE////<////////////////A//
@AB1033.2 NB501277:76:HWNK2BGXX:1:11101:22107:1082 length=68
TTGGGATCTACGGCCTGGACTTCTATGTGGTGCTGGGTAGGCCAGGGTTCAGCATCGCAGACAAGAAG
 AB1033.2 NB501277:76:HWNK2BGXX:1:11101:22107:1082 length=68
EEAAEEEEEEEEEAEEEEEEEEEAEEEEEE/EEEE/EEAEEEEEAEEEEEEEEEEEE<AEEAAE/EA/

不过,附件里面本来就有表达矩阵,倒没有必要自己去重新处理一遍。

3. smFISH

基因表达的调控是决定细胞命运和行为的关键因素之一。基因表达的主要参数是mRNA水平,其水平取决于转录和降解的速率。因此,测量mRNA水平以及特定转录本(或所有转录本)的转录和衰变速率一直是众多研究项目的重点。常见的分子生物学技术,例如逆转录PCR(RT-PCR),RNA印迹分析或RNA测序(RNA-Seq),通常需要从整个细胞群体中提取RNA。但是,结果仅提供了整个细胞群体中mRNA含量的相对测量值,而单个细胞信息却丢失了。单细胞RNA-Seq可以提供有关转录水平的细胞间变异性的更多信息。但是,对于给定的RNA转录本,当前的检测下限约为10个分子/细胞。RNA定位研究表明,RNA在细胞中的空间分布对其功能起关键作用,但是上述方法在此过程中会丢失该信息。

单分子原位荧光杂交(smFISH)克服了这些限制。在这种方法中,首先将细胞固定并透化。然后,将细胞与一组探针杂交,该探针由多个短的荧光标记的DNA寡核苷酸组成,它们平铺了mRNA的长度。

单个RNA分子上的多种探针增加了信噪比,并允许通过显微镜将其检测为强度和尺寸相似的衍射受限斑点。在图像分析工具中使用3D高斯拟合算法来检测图像中的斑点。smFISH可以检测到的单个RNA分子少至数千个。重要的是,smFISH可提供细胞中RNA定位的空间信息。

「smFISH」有两个主要缺点

首先,由于细胞是固定的,因此无法将smFISH用于同一细胞中基因表达的时间分析(即实时成像)

其次,由于荧光团的局限性(即显微镜只能使用少量的颜色),smFISH目前仅限于在单个实验中仅研究1-4个基因。但是,存在smFISH的多种变异,从而导致信号增强,分辨率提高和/或多路复用,并最终同时检测到数十个到数百个基因的转录本。smFISH可用于任何生物体,细胞培养和组织切片中。尽管基本协议概念相似,但是每种样本类型都需要专用协议(在文献中非常丰富)

4.肝脏代谢分区

肝脏代谢包含大量相互关联的合成代谢和分解代谢功能,这些功能可以同时执行而不会浪费能量。为了应对这一挑战,肝实质显示出相当大的异质性和功能可塑性,称为代谢区带。这里总结了该领域令人瞩目的技术成就,涵盖了在分区表征和可视化方面的最新进展,并概述了一个新兴的主调节器网络,可确保体内稳态的适当维持和肝功能的能量优化。

肝脏显示出明显的均匀解剖结构,该结构由呈蜜梳状图案的主要六边形小叶的规则排列组成。在从门户小静脉和肝动脉这些小叶血液周边进入血窦,肝的最小毛细管,其形成一个交织的网络运行同心到中央静脉,其中血液排入肝小静脉。沿门-中心轴排列成正弦曲线的海绵状排列的肝细胞在其生化和生理功能方面表现出显着的异质性。这种动态的结构和功能异质性,称为代谢区带,这似乎是在各种生理条件下同时执行维持生物体代谢稳态所需的过多功能的前提。在代谢区划进步及其调控进行综合从不时检讨,并且最终导致Wnt信号的发现/β-catenin信号作为区划。本综述试图对过去十年中分区研究的令人印象深刻的发展进行更新。可以推测,对精细的分区调节的干扰可能会对各种代谢性疾病的发展产生巨大影响。因此,我们的综述的主要目的是确定需要回答的重要开放性问题,以便更深入地了解肝脏分区的机制,其调节以及疾病的可能失灵。

5.MARS-Seq

好处:

  • 单细胞的高通量转录分析
  • 数千个细胞的体内采样
  • 三种条形码级别(分子,细胞和板级标签)促进了强大的复用能力
  • 处理100至1000个单电池
  • 将所有单个细胞合并为1个流通池可将成本降低到每个细胞不到50美分

缺点:

  • 纯化步骤中可能发生3'偏差
  • 片段化步骤消除了特定于链的信息

na

0 人点赞