直播展示单细胞降维聚类分群的时候有小伙伴说我们昨天和今天大家结果居然不一样!
肺癌单细胞数据集也有好几十个了,拿到表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45 ,PTPRC),
- epithelial/cancer (EpCAM ,EPCAM),
- stromal (CD10 ,MME,fibo or CD31 ,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。所以是很容易降维聚类分群啦, 今天的结果如下所示:
今天的结果
然后小伙伴打开了他昨天拿到的代码和结果,详见:换一个分析策略会导致文章的全部论点都得推倒重来吗
看起来似乎是完全不一样,但是实际上不应该是使用肉眼来判断!
一个很简单的方式是代码判断:
代码语言:javascript复制load('phe.Rdata')
phe2 = phe
load('phe1/phe.Rdata')
phe1 = phe
ids = intersect(rownames(phe1),rownames(phe2))
gplots::balloonplot(table( phe1[ids,'celltype'] ,
phe2[ids,'celltype'] ))
如下所示,可以看到两次结果其实是几乎是一模一样:
但是在肉眼看起来就差异很大!