作者,Evil Genius
这一篇我们来总结一下空转平台和实际运用。
将数百个生物学大分子定位到组织中离散的位置、结构和细胞类型的能力是了解器官的细胞和空间组织的有力方法。空间分辨转录组学技术能够以多重方式在单细胞或接近单细胞分辨率下绘制转录本。空间转录组学技术的快速发展加快了包括肾脏病学在内的多个领域的发现步伐。它在临床前模型和人体样本中的应用,为单细胞测序发现的新细胞类型提供了空间信息,为niche内细胞-细胞相互作用提供了新的见解,并提高了对损伤反应中发生的变化的理解。空间转录组学技术与其他组学方法的整合,如蛋白质组学和空间表观遗传学,将进一步促进全面分子图谱的生成,并提供对动态平衡和疾病中分子成分动态关系的见解。
Key points
1、空间分辨转录组学技术允许以多种方式在单细胞或接近单细胞分辨率下对转录本进行空间定位,目前包括基于测序的技术和基于成像的方法。基于测序的技术包括全转录组原位捕获和基于兴趣区域的空间RNA分析平台;基于成像的技术包括各种大规模多路原位杂交方法 2、空间转录组学技术的关键数据输出包括由分解单细胞技术衍生的细胞类型和状态的标记,空间可变基因表达的确定以及功能邻域的注释。 3、空间技术能够在组织病理学背景下定位生物学相关的细胞相互作用,并识别与形态和组织病理学变化相关的疾病相关的细胞信号传导途径。 4、空间技术正在迅速发展,可以在整个转录组水平上提供单细胞特征。此外,这些技术正越来越多地与空间蛋白质组学或表观基因组学等正交技术相结合,以定义基因和蛋白质调控模式。
知识背景
生物学研究长期以来的目标是确定固定组织中RNA分子的空间分布和数量。早期实验采用原位杂交(ISH)检测靶基因的表达。
基因组学技术的进步为生物分子的测量提供了多种选择,包括DNA、RNA、蛋白质和代谢物。对于RNA,这包括通过对完整组织或细胞中特定靶基因的测序和空间定位,对大块组织或分解细胞中mRNA水平进行全面、高含量、全基因组测量。这些方法有可能促进新发现,产生和验证假设,并使临床病理相关性能够收集有关疾病发病机制的新见解
目前空间转录组学的运用
空间转录组学是指组织中mRNA表达的定位和/或测量。它通过RNA转录本的直接原位成像或将空间信息(通过从组织学组织切片获得的精确坐标的共同配准)与来自同一组织的RNA测序数据相结合来实现。空间转录组学技术提供了巨大的潜力,以帮助我们了解健康和疾病状态下的生物学相关细胞组织。在过去几年中,空间转录组学技术的快速发展使得在亚细胞分辨率下对多个RNA靶点进行分子测量成为可能。迄今为止,这些技术已被用于各种原因:验证单细胞测序发现的新细胞类型的身份;提供已识别细胞类型的空间信息;产生新的见解细胞-细胞或邻里关系内的功能组织单位;揭示健康和疾病环境中以前未被重视的生态位多样性;并为相邻细胞之间发生的配体-受体分子相互作用提供机理上的见解。
空间转录组学方法
总的来说,空间转录组学技术可以分为两种主要方法:利用下一代测序的方法和基于原位成像的方法。
Sequencing-based技术
流行的ISC平台包括Visium, Slide-seq和Stereo-seq。标准Visium spot直径为55µm,可覆盖2~5个以上细胞,因此无法实现单细胞分辨率;然而,具有2 × 2 μ m方形无间隙探头的更高清晰度产品现在已经上市。Slide-seq提供接近单细胞的分辨率,spot大小为10µm,尽管单个spot可能覆盖两个或三个细胞,这取决于它们在组织内的细胞组织和大小。Stereo-seq提供RNA的亚细胞分辨率,spot大小为220 nm。然而,该技术衍生的cDNA必须在专有测序仪上测序,而不是在标准Illumina测序仪上测序。经验表明,在定位特异性和特征深度之间可能存在权衡,与使用具有较小spot大小的技术识别低水平表达的基因相比,更倾向于识别高表达的基因。
Region of interest-based sequencing
作为基于ISC的方法的替代方案,全转录组空间RNA分析平台在空间上将读取定位到感兴趣区域(ROI)。例如,GeoMx平台可以使用仪器的紫外激光和显微镜从载玻片上的粘附组织中监督选择ROI。然后将每个ROI的RNA沉积在96孔板中并进行条形码测序。与ISC技术相比,GeoMx的优势包括能够根据损伤和炎症的功能组织单位或区域选择ROI,并且每个样品的检测成本较低,基因数量相似(约18,000个)。缺点包括与spot相比,总体ROI数量较低,缺乏单细胞特异性,以及手动选择ROI时的选择偏差。为了获得比GeoMx提供的ROI更精细的分辨率,两种技术 sci-SPACE和XYZeq 现在提供组织内单个细胞的条形码,以便在单细胞分解和测序之前捕获空间信息。
原位测序和杂交
原位测序(ISS)方法包括将mRNA逐个核苷酸逆转录为cDNA,然后通过滚动圈扩增对其进行测序,其中引物被环状DNA模板扩增以产生具有多个重复序列的cDNA。在每个测序周期中,图像传感器检测预先指定的RNA靶序列的荧光标记探针,每个定位到组织中的细胞。ISS的例子包括荧光原位测序和空间分辨转录扩增子读出图谱。这两种平台都以亚细胞分辨率测量约1000个多路靶标的RNA信号;然而,测序时间长,灵敏度低于荧光ISH (FISH)方法,特别是增加了多路复用。
ISS和FISH都是基于显微镜的空间转录组学技术,针对预定的候选mRNA列表。重要的是,FISH能够以高灵敏度检测低水平表达的转录本。该技术基于编码探针的使用,编码探针依次结合到组织上的mRNA,而组织又被荧光报告探针结合。Visium FFPE平台通过测序数据中的空间注册条形码推断转录本的空间定位,而原位成像技术中使用的探针保留在组织或细胞中,从而能够直接推导精确的空间信息。
在过去的几年中,已经出现了许多方法,可以直接检测100-10,000个探针,用于原位检测同一组织中的mRNA分子。包括MERFISH、CosMx、Xenium、molecular cartography和seqFISH 。关键优势在于,它们有可能为mRNA在细胞核和细胞质中的亚细胞定位提供新的生物学见解,这有助于细胞分割,并提高我们对不同细胞状态下转录动力学的理解。
分析的关键
空间转录组学技术的快速发展要求开发分析方法,最大限度地从原始数据中提取生物学见解。空间转录组学数据输出大致可分为三类:空间背景下细胞类型的定位;空间可变基因(SVGs)的测定;建立功能相关的niche。为了实现这些数据输出,分析pipeline必须从细胞类型的分子定义开始,这是从文献或单细胞或单核RNA测序(scRNA-seq或snRNA-seq)数据中收集的,然后进展到标记转移,其中基于scRNA-seq(这里指的是scRNA-seq和snRNA-seq)数据的基因表达谱的细胞身份知识通过迁移学习在空间转录组数据中注释细胞。由于一些空间转录组学方法不是单细胞分辨率的(例如Visium和GeoMx),并且空间定位的mRNA由多个细胞贡献,因此可以使用反卷积方法来确定基于scRNA-seq数据的这些区域的细胞身份。每个细胞的空间识别依赖于分割,其中基于核或形态标记推断细胞边界,最终推断组织中每个细胞中的mRNA。
细胞类型定位的分析方法
与scRNA-seq数据集相比,空间转录组数据可能缺乏可检测的基因数量或检测特定细胞的能力,这是由于杂交中使用的靶标或测序过程中从细胞中有效捕获mRNA分子的限制。在空间转录组学中,特定的细胞类型最常用的定位和鉴定方法是使用标签转移或反卷积策略,使用来自scRNA-seq数据的细胞类型注释。Seurat是scRNA-seq数据聚类最常用的工具,通过将每种细胞类型的特征定义为载体来定义细胞类型。然后,描述每个cluster的标签可以通过一个过程转移到组织中,这个过程本质上是选择最可能的细胞类型,这些细胞类型映射到空间转录组数据中的特定位置或细胞。Seurat版本5现在包含了各种空间转录组数据集的显示功能,例如Visium和CosMx。然而,其他工具,如Tangram, STELLAR, CellTrek, SPOTlight,RCTD和cell2location,也可用于推断组织内细胞或spot的细胞类型。其中许多方法已经在其他地方进行了运用。当spot覆盖多个细胞时,这些技术也可用于对来自不同细胞类型的特征进行反卷积。这些技术中的每一种都有不同的潜在数学性质,这可能导致细胞或spot的定义有相当大的差异。根据在测试多种方法和构建成人肾脏图谱方面的经验,在肾脏中,一些技术似乎导致某些细胞(如一些免疫细胞和插层细胞)的过度估计。因此,稳健的方法是使用两种方法(Seurat和CellTrek)来确认从scRNA-seq到空间转录组数据的细胞类型转移,并在可行的情况下通过潜在组织学进一步确认发现。
空间可变基因的测定
Establishing functionally relevant neighbourhoods
空间转录组数据的第三个潜在输出是识别生物相关的邻域(也称为生态位)。邻域是细胞与其他细胞和细胞外物质发生潜在生物相互作用的环境。例如,上皮细胞的邻域可包括间质和常驻的间质、免疫细胞、基质、神经和脉管系统。空间转录组可视化工具是建立这样的社区的必要条件。目前,领先的可视化工具是Vitessce, Squidpy和Giotto。Squidpy是一个工具,它允许处理和分析空间转录组数据,并具有可视化的附加功能。Giotto既是一个可视化工具(Giotto Viewer),也是一个分析平台(Giotto Analyser),它将scRNA-seq数据集与空间转录组学数据集成在一起。Giotto已针对seqFISH 、Visium、Slide-seq等空间转录组学技术进行了优化。
定义邻近区域的一种方法是使用细胞测量软件,如组织探索和分析,它可以帮助定义每个细胞中心周围的物理距离或半径,并量化半径内邻近的细胞。然而,任何细胞术或可视化工具都需要单细胞分辨率的空间转录组数据才能有效。对于像Visium ST这样的技术,每个spot覆盖多个细胞,每个单独的spot可以被认为是一个邻域。反卷积后,可以确定每种细胞类型表达的基因对每个spot的贡献比例,并使用它们的相对比例来确定该邻域的组成。该分析有助于量化组织中特定健康和病变上皮细胞的相对比例,这是一个重要的特征。在该图谱中,肾脏疾病患者活检样本中TAL邻域的量化显示,改变状态的TAL邻域相对增加。因此,邻域是比较不同组织中细胞分布和了解病理生物学的重要手段。
Integration with other omics modalities
没有一种可用的空间转录组学技术可以单独建立一个器官的全面分子图谱。虽然空间转录组学分析的数据输出可能是稳健的,但如果没有正交转录组学、蛋白质组学或表观基因组学分析数据的多模式整合,它们是不完整的。需要多种模态来定义细胞的身份和功能。与目前的空间转录组学技术相比,scRNA-seq具有更高的灵敏度和特异性。对于非单细胞空间转录组学技术,如Visium、Slide-seq和GeoMx,与scRNA-seq数据的集成允许对数据进行反卷积,以确定细胞类型的组成以及它们在响应点、头或ROI部分的病理生理或环境扰动时可能采取的不同状态。相比之下,单细胞空间转录组方法,如Xenium、MERFISH和CosMx,还不能提供全转录组特征。
空间表观、甲基化等数据还需要整合进入空间转录组。