肾癌单细胞数据集也有十多个了,拿到表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45 ,PTPRC),
- epithelial/cancer (EpCAM ,EPCAM),
- stromal (CD10 ,MME,fibo or CD31 ,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。比如 Genome Biology (2022) 的文章《Decoding the multicellular ecosystem of vena caval tumor thrombus in clear cell renal cell carcinoma by single‐cell RNA sequencing》,就是如此:
第一层次降维聚类分群
绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。
反而是上皮细胞,大家很少涉及到,但是肾癌既然是来源于肾这样的组织, 它的上皮细胞就不可能是一个纯粹的上皮,理论上是可以细分的。上面的这个文章其实也接下来部分细分,如下所示:
上皮细胞的部分细分
但是还远远不够,我参考两个肾脏单细胞文章整理了一下基因列表,希望对你有帮助。
首先是2019的一篇 PNAS 文章:《 The single-cell transcriptomic landscape of early human diabetic nephropathy 》如下所示:
2019的一篇 PNAS 文章
然后是2021的NC的文章:《Single cell transcriptional and chromatin accessibility profiling redefine cellular heterogeneity in the adult human kidney》,如下所示:
2021的NC的文章
有了这两个文章的基因列表,很容易写代码给其它肾脏相关疾病单细胞转录组项目进行实战:
代码语言:javascript复制cg1=c('SLC34A1','LRP2','HAVCR1','CFH','SLC12A1','SLC12A3','SLC8A1','AQP2','SLC26A7','SLC26A4','NPHS2','EMCN','PIEZO2','COL1A2','PTPRC')
p <- DotPlot(sce.all, features = unique(cg1),
assay='RNA' ) coord_flip()
p
ggsave('check_GSE151302_markers.pdf' )
cg2=c('CUBN','LRP2','SLC34A1','SLC5A12','SLC5A2','ALDOB','CFH','SLC12A1','SLC12A3','SLC12A2','SLC8A1','AQP2','AQP6','SLC26A4','ATP6V0D2','NPHS1','NPHS2','PECAM1','FLT1','PDGFRB','PTPRC')
p <- DotPlot(sce.all, features = unique(cg2),
assay='RNA' ) coord_flip()
p
ggsave('check_GSE131882_markers.pdf' )
练习题
我给几个数据集给大家,去试试看,能不能从里面把上皮细胞拿出来,并且进行细分亚群,看看能不能有上面列出来的亚群。
- 2021-GSE171458-肾脏疾病对照分组比较
- 2021-GSE156632-ccRCC
- 2021-GSE121638_ccRCC-3个患者N-T配对
- 2021-SCP1288-IBC-ccRCC
- 2021-PRJNA705464-多位点-ccRCC
- 2021-stage-ccRCC
其实这样的基础认知,也可以看基础10讲:
- 01. 上游分析流程
- 02.课题多少个样品,测序数据量如何
- 03. 过滤不合格细胞和基因(数据质控很重要)
- 04. 过滤线粒体核糖体基因
- 05. 去除细胞效应和基因效应
- 06.单细胞转录组数据的降维聚类分群
- 07.单细胞转录组数据处理之细胞亚群注释
- 08.把拿到的亚群进行更细致的分群
- 09.单细胞转录组数据处理之细胞亚群比例比较
最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释