肺癌样品里面的正常的上皮细胞是什么(单细胞CNS图表复现23)

2021-12-16 16:33:39 浏览数 (1)

前面我们已经成功完成了《CNS图表复现专辑》的前20个关键图表的复现,现在开启第二波图表复现,会大量触及到补充图表。目录及前面的代码总结 CNS图表复现专辑第二波开启

我们在前面的教程:CNS图表复现09—上皮细胞可以区分为恶性与否 提到了五千多个上皮细胞里面只有三千七百左右是恶性细胞,那么一千七百多个的正常的上皮细胞是什么呢?而且前些天我们 比较了copykat和infercnv这两个从单细胞转录组数据推断肿瘤拷贝数变异技术差异 ,可以看到如果混合全部的病人的上皮细胞,使用infercnv更容易判断上皮细胞里面的恶性肿瘤细胞!

其实文章也在附件里面提到:The non-cancer epithelial cell clusters (n = 16) were further annotated into cell subtypes (Figures S1D and S1E). 他们的数量如下所示:

一千七百多个 的正常的上皮细胞

可以看到正常水平细胞主要是 AT1和AT2 cells ,因为取材是肺部,因为取材跨越了不同治疗阶段(靶向治疗前(TN)、病灶残留阶段(RD)、复发阶段(PD)) ,而且不仅仅是原发肿瘤部位,如果是转移瘤里面混入及少量的肝细胞,神经细胞就可以理解了。

原文还展示了另外一种质量控制图表,就是不同细胞亚群各自的细胞测序情况,可以看到肿瘤恶性细胞的基因数量是最多的,甚至都可以使用基因数量来作为一个评价标准,来区分细胞恶性与否了!

不同细胞亚群各自的细胞测序情况

另外,其实这个图是上皮细胞的戏份,不知道为什么作者在这里要展现其算法混入的基质细胞的5个亚群,感觉完全没有必要啊!

这个时候,直接对这个上皮细胞表达量矩阵进行降维聚类分群,然后可视化 AT1和AT2 cells ,club和ciliated细胞 的 特异性 基因即可:

代码语言:javascript复制
# epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
# - alveolar type I cell (AT1; AGER )
# - alveolar type II cell (AT2; SFTPA1)
# - secretory club cell (Club; SCGB1A1 )
# - basal airway epithelial cells (Basal; KRT17 )
# - ciliated airway epithelial cells (Ciliated; TPPP3 ) 

但是我做出来的比例跟作者不一样:

上皮细胞表达量矩阵进行降维聚类分群

而且图里面的SCGB1A1基因不明显,也就是说 secretory club cell 可能是被混入到了其它上皮细胞里面。支气管上皮组织中的Ciliated cell, club cell, goblet cell 以及 basal cell 我们差不多都可以找到了,也是绝大部分人主要关注的:

  • 基底细胞(Basal cell)
  • 棒状细胞(Club cell)
  • 杯状细胞(Goblet cell)
  • 纤毛细胞(Ciliated cell)

那么问题来了,肺癌里面的恶性肿瘤细胞来自于哪个细分上皮细胞呢?

是这里面的提到的 AT1和AT2 cells ,club和ciliated细胞 吗?

恶性肿瘤细胞来自于哪个细分上皮细胞

而且,更进一步, 上皮细胞的恶化有清晰路径吗?这些不同上皮细胞亚群有很清晰的发育先后路径吗?

而且,关联这些上皮细胞的降维聚类分群结果,跟前面的inferCNV结果,可以看到,我们的 AT1和AT2 cells 是比较清晰的正常上皮细胞,大概率是没有恶性的,但是 basal这个细胞很大概率上已经是恶性了。

basal这个细胞很大概率上已经是恶性了

也可以看具体的细胞数量情况:

代码语言:javascript复制
              1    2    3    4    5    6
  AT1         0  127    0    0   14    6
  AT2         0   55    0    0  355   37
  Basal      54   40   17  433  123  105
  ciliated    0  102    0    0  282    1
  tumor     880 1124  234  189  376  676

因为 前面的inferCNV结果里面的 2和5 是正常二倍体细胞,所以,我们的分析顺序弄错了,应该是先根据inferCNV结果挑选出来2和5的亚群,或者说正常二倍体亚群,然后进行降维聚类分群去区分上皮细胞亚群。

也就是说如下所示的拷贝数变异全景图里面的 细胞:

拷贝数变异全景图

上皮细胞其实可以更进一步

文章:《Pre-activated antiviral innate immunity in the upper airways controls early SARS-CoV-2 infection in children》就可以看到更多上皮细胞亚群:

更多上皮细胞亚群

除了前面的 AT1和AT2 cells ,club和ciliated细胞 , 还有 Goblet和Squamouse以及 lonocyte细胞。

另外,文章:《Resolving the Spatial and Cellular Architecture of Lung Adenocarcinoma by Multiregion Single-Cell Sequencing》也提到了类似的上皮细胞细分情况:

类似的上皮细胞细分

这7万多个上皮细胞,也有 AT1和AT2 cells ,club和ciliated细胞,以及 lonocyte细胞,Bronchio细胞,各自有自己的高表达量基因:

不同上皮细胞有自己的高表达量基因

这些基因又可以复制粘贴到自己的项目里面去进行可视化啦,看看能否把上皮细胞进行文献里面的这样的细致的分群!

0 人点赞