刷到了一个2022年9月的science杂志的文章,标题是:《Lineage plasticity in prostate cancer depends on JAK/STAT inflammatory signaling》,里面的单细胞数据集有3个,包括肿瘤小鼠模型,类器官,病人单细胞数据,工作量蛮大,数据分析也很精彩。但是里面有一个小小的瑕疵, 就是说肥大细胞是淋巴系免疫细胞。如下所示的降维聚类分群:
文章描述的第一层次降维聚类分群所采用的标记基因是;
- EPCAM or CHGA/CHGB (epithelial/NEPC, 27,693 cells),
- PTPRC and either CD2/CD3E, CD79A, or TPSB2 (lymphoid; 7,704 cells),
- PTPRC and CD14 and/or LYZ (myeloid; 5,875 cells),
- COL1A1/VIM and/or CLDN5 (mesenchymal and endothelial; 9,822 cells)
可以看到,TPSB2很明显是mast细胞,也就是说肥大细胞的基因,但是不小心被这个science杂志刚刚发表的文章把肥大细胞归为了淋巴系免疫细胞。肿瘤相关单细胞数据集常规分析都是拿到表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45 ,PTPRC),
- epithelial/cancer (EpCAM ,EPCAM),
- stromal (CD10 ,MME,fibo or CD31 ,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。
后来做的单细胞数据集越来越多,我也慢慢的积累了自己的标记基因列表,每次有小伙伴想跟我学习单细胞,我就让他先背诵下面的基因 :
代码语言:javascript复制# T Cells (CD3D, CD3E, CD8A),
# B cells (CD19, CD79A, MS4A1 [CD20]),
# Plasma cells (IGHG1, MZB1, SDC1, CD79A),
# Monocytes and macrophages (CD68, CD163, CD14),
# NK Cells (FGFBP2, FCG3RA, CX3CR1),
# Photoreceptor cells (RCVRN),
# Fibroblasts (FGF7, MME), 'DCN', 'LUM', 'GSN'
# Endothelial cells (PECAM1, VWF).
# epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
# immune (CD45 ,PTPRC), epithelial/cancer (EpCAM ,EPCAM),
# stromal (CD10 ,MME,fibo or CD31 ,PECAM1,endo)
library(ggplot2)
genes_to_check = c('PTPRC', 'CD3D', 'CD3E', 'CD4','CD8A',
'CD19', 'CD79A', 'MS4A1' ,
'IGHG1', 'MZB1', 'SDC1',
'CD68', 'CD163', 'CD14',
'TPSAB1' , 'TPSB2', # mast cells,
'RCVRN','FPR1' , 'ITGAM' ,
'C1QA', 'C1QB', # mac
'S100A9', 'S100A8', 'MMP19',# monocyte
'LAMP3', 'IDO1','IDO2',## DC3
'CD1E','CD1C', # DC2
'KLRB1','NCR1', # NK
'FGF7','MME', 'ACTA2', ## fibo
'DCN', 'LUM', 'GSN' , ## mouse PDAC fibo
'Amy1' , 'Amy2a2', # Acinar_cells
'PECAM1', 'VWF', ## endo
'EPCAM' , 'KRT19', 'PROM1', 'ALDH1A1' )
genes_to_check = c('PTPRC', 'CD3D', 'CD3E', 'CD4','CD8A',
'CCR7', 'SELL' , 'TCF7','CXCR6' , 'ITGA1',
'FOXP3', 'IL2RA', 'CTLA4','GZMB', 'GZMK','CCL5',
'IFNG', 'CCL4', 'CCL3' ,
'KLRB1','NCR1', # NK
'PRF1' , 'NKG7','MKI67' ,'TOP2A')
genes_to_check = c('CD68', 'CD163', 'CD14',
'CD86','C1QA', 'C1QB', # mac
'S100A9', 'S100A8', 'MMP19',# monocyte
'LAMP3', 'IDO1','IDO2',## DC3
'MRC1','MSR1','ITGAE','ITGAM','ITGAX','SIGLEC7',
'CD1E','CD1C', # DC2
'XCR1','CLEC9A','FCER1A',# DC1
'GZMB','TCF4','IRF7')
th=theme(axis.text.x = element_text(angle = 45,
vjust = 0.5, hjust=0.5))
p_all_markers=DotPlot(sce.all, features = genes_to_check,
assay='RNA' ,group.by = 'celltype' ) coord_flip() th
但是毕竟自己只是“野路子”的个人经验汇总而已,处理了三百多个单细胞数据集我这些基因列表都蛮好用的,做到第一层次降维聚类分群和生物学命名不是问题。
看到了这个science杂志刚刚发表的文章把肥大细胞归为了淋巴系免疫细胞,我差一点以为是自己的生物学背景知识出问题了,所以搜索了一下发现肥大细胞(Mast Cell )前体与嗜碱性粒细胞来源相近,经扩散进入血流,进而进入组织,在那里进一步分化为成熟的非增殖颗粒阳性肥大细胞。
而粒细胞很明显是髓系的:
- Neutrophils(中性粒细胞),是人类血液中最丰富的髓样细胞,但由于其生存期短、终末分化和非增殖的性质,功能重要性常常被忽视。中性粒细胞的多样性可能是由于它们作为急性感染或炎症第一反应细胞的重要功能。近期研究发现,中性粒细胞存在高度可塑性。
- Eosinophil(嗜酸性粒细胞),含有过氧化物酶和酸性磷酸酶,可以释放出来抵御外界病原感染,具有杀伤细菌、寄生虫的功能,也是免疫反应和过敏反应过程中极为重要的细胞。
- Basophil(嗜碱性粒细胞),主要生理功能是参与人体的变态反应,当机体发生变态反应时,嗜碱性粒细胞比率就会增高,如过敏性鼻炎和皮肤过敏等。
理论上,这个肥大细胞(Mast Cell )是髓系来源,大概率上是这个science杂志刚刚发表的文章的一小处笔误吧。