知识积累---空间数据结合图像分割实现单细胞级解卷积分析

2024-09-01 00:01:03 浏览数 (2)

作者,Evil Genius

今日参考文献

中国人发表的,但是,

这里多说一句,大家有条件多支持一下正版,盗版如果横行,说实话没有动力做下去了,这是大多数原创者的心声,当然了,我做学生的时候,也没钱,资料很多也是盗版,工作了以后也买卖过盗版, 现在不过不再跟盗版打交道了,知道了其中的辛酸。

当然了,量力而行,别跟我读书似的一个月就500的补贴,还非要买几千上万块钱的资料,家里条件很好,这可以,否则就叫败家。

花了钱的,好好学习,变成自己的,才是目的。

知识积累

  • 对空间转录组而言,在固定位置获取的相同大小的spot不能精确捕获随机位置的单细胞,因此本质上不能在单细胞水平上描述转录组(无论是10X Visium 、HD、华大、百迈客都有这样的问题)。

最佳的解决方案:将空间转录组与其匹配的基于组织学图像的形态对齐,恢复缺失的细胞,从而实现真正的单细胞水平和全片尺度的反卷积、卷积和聚类低分辨率和高分辨率spot。

  • 目前可用的空间分辨转录组学技术有两大类:(i)原位杂交或原位测序技术,如seqFISH、MERFISH、STARmap和FISSEQ;(ii)原位捕获技术,如空间转录组学(ST)、SLIDE-seq、ZipSeq和HDST。
  • 迄今为止,最主要的商用测序技术是10X Visium,这是一种基于spot的空间转录组学,在2018年从ST技术进一步发展而来。

基于spot的空间转录组学的主要技术限制之一在于spot的低分辨率,它通常覆盖多个细胞。目前的10X Visium spot尺寸为直径55 μm,spot覆盖细胞的数量根据生物组织的不同在1到30之间。为了提高分辨率,BayesSpace提出利用贝叶斯统计绘制空间转录组数据中的邻域结构,将分辨率提高到subspot水平。xfuse的方法使用深度生成模型将空间转录组与组织学图像数据相结合,可以在微米分辨率下表征解剖特征的转录组。还有一些方法,如stLearn和SpaGCN,将组织学图像整合到空间上平滑基因表达,并改善了连续空间模式的聚类。除了计算加强之外,空间转录组学技术的分辨率也在不断提高,例如,新版本的10X Visium HD,达到了2um 的精度。

然而,细胞大小的spot分辨率不等于单细胞水平。与单细胞测序技术不同的是,相同大小和固定位置的spot无法精确捕获实际大小不同、位置随机的细胞,仍然可以部分覆盖同时接近的多个细胞,这使得基于spot的空间基因表达无论spot大小如何,本质上都无法达到单细胞水平。这种单细胞水平的缺乏不能通过目前的方法来解决,仅通过计算或技术上提高spot分辨率,阻碍了空间转录组学中单个细胞空间组织和细胞类型特异性基因表达变异的表征。此外,在Visium平台上,在面积为6500 × 6500μm2的载玻片上分布了4992个直径为55 μm的spot,两个spot中心之间的距离为100 μm,在~70%的面积内未测量基因表达。

与新鲜冷冻组织相比,FFPE组织的染色图像更好地保留了细胞形态,因此可以更准确地分割细胞核。

将空间转录组数据与匹配的基于组织学图像的细胞核形态信息相结合,以弥合spot分辨率和单细胞水平之间的差距。

结果1、单细胞分辨率不等于单细胞水平

在10X Visium平台上,将组织切片放置在载玻片上,在载玻片上用条形码逆转录物(RT)引物在固定坐标上分析相同大小的spot。在组织渗透过程中,mRNA分子垂直向下扩散到固体表面,并在原位spot内与RT引物局部杂交。进一步提取cDNA mRNA复合物用于文库制备和测序读出。与单细胞RNA测序(scRNAseq)不同的是,单细胞技术可以精确地单独捕获每个细胞并描绘整个细胞的基因表达,而预定位置的spot极有可能同时部分覆盖近距离的多个细胞。然而,这些空间数据不能仅仅通过计算或技术上将spot大小缩小到单细胞大小来解决,即单细胞分辨率不是单细胞水平。

10X HD数据仍然有很大的机会部分覆盖多个细胞(这个在课程上已经讲过了)。一个spot,即使在非常小的尺寸上,仍然很可能同时覆盖多个细胞,每个细胞覆盖的很小一部分,使得spot仍然捕获细胞类型的混合基因表达。

因此,spot分辨率和单细胞水平之间的上述差距提出了新的计算挑战:分别针对低分辨率和高分辨率spot的“单细胞反卷积”和“单细胞卷积”。其中的区别在于单细胞反卷积是指将大的低分辨率spot分裂成单个细胞,而单细胞卷积是指将相邻的高分辨率spot覆盖的小块组装成一个完整的单个细胞。

结果2、STIE工作流程概述

  • spot水平的基因表达和基于匹配组织学图像的细胞核分割。

STIE的基本原理是,给定细胞类型转录组特征,可以从每个spot的基因表达估计细胞类型比例,同时也可以从组织学图像中通过分割细胞/细胞核,提取细胞/细胞核形态特征,将单个细胞聚类成groups,定位每个单个细胞并计算每个spot覆盖的细胞比例。STIE有两种模式:(1)单细胞反STIE有两种模式:(1)单细胞反卷积/卷积:根据细胞类型转录组特征,STIE将低/高分辨率spot反卷积/卷积成单细胞。转录组特征可以从现有的不同组织的单细胞图谱中定义。(2)单细胞聚类(Signature-free 单细胞反卷积/卷积):在没有细胞类型转录组特征的情况下,STIE可以在单细胞水平上进行聚类。聚类算法建立在反卷积/卷积的基础上:给定聚类数量和聚类转录组特征的初始值,STIE迭代改进基于单细胞反卷积/卷积的聚类特征,并重新估计特征,直到迭代收敛。

最后,根据spot基因表达和细胞形态,被spot覆盖的细胞被分配细胞类型,其中也包括那些位于捕获区域的spot大小之外但位于扩大的spot区域范围内的细胞。因此,STIE填补了spot间隙区域中缺失的细胞。

结果3、基因表达和核形态的整合使单细胞水平的反卷积/卷积在空间转录组学中得以实现(小鼠脑、乳腺)

结果4、STIE将空间转录组聚类提高到单细胞水平

结果5、STIE揭示了单细胞水平的空间转录组学见解

与单细胞基因表达谱不同,spot不能总是捕获完整的细胞,导致spot边界细胞的信息丢失或外部细胞的污染。因此,提出了第一个问题:被spot捕获的基因表达是来自spot内的所有细胞,还是来自spot外的更多细胞?

其次,与传统的细胞型反褶积方法不同,STIE将细胞核形态信息与基因表达结合起来。

基于细胞类型反卷积的细胞类型共定位。在给定基因表达的情况下,可以估计每个spot内的细胞类型比例。

结果6、STIE能够研究空间分辨的细胞-细胞相互作用

最后,感受一下效果

图像分割前图像分割前
图像分割后图像分割后

必须要结合图像分割

示例代码在GitHub - zhushijia/STIE: Spatial Transcriptome Image and Expression integration enables single cell level spatial data analysis。

生活很好,有你更好

0 人点赞