看到了《单细胞天地》公众号分享了一个学徒实战的笔记,详见:BD平台单细胞的优点都被你弄丢了,那个肺癌的免疫治疗数据集在GSE207422,很容易读取作者给出来了的表达量矩阵后进行降维聚类分群,然后我看了看结果里面的中性粒细胞种qc指标都很差,确实很容易被忽视。。。。
中性粒细胞种qc指标都很差
既然这个捕获中性粒细胞是BD单细胞转录组的卖点,那么是不是只要是选择了这个技术就一定能能捕获到中性粒细胞呢?让我们随机看看其它比较新的文章,比如同样的2023的《Single-cell and spatial transcriptome analysis reveals the cellular heterogeneity of liver metastatic colorectal cancer》,数据 是 196,473 CD45 immune cells from 27 samples of six CRC patients, 链接在;https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE225857
可以看到, 如下所示的文件:
代码语言:javascript复制GSM7058754_immune_counts.txt.gz 213.9 Mb
GSM7058754_immune_meta.txt.gz 9.6 Mb
GSM7058755_non_immune_counts.txt.gz 86.2 Mb
GSM7058755_non_immune_meta.txt.gz 1.9 Mb
这次为了避免遇到了学徒那样的错误,详见:BD平台单细胞的优点都被你弄丢了,我亲自操作来处理它,确实是不过滤核糖体了,怕中性粒细胞被我误伤。。。
代码语言:javascript复制rm(list=ls())
options(stringsAsFactors = F)
source('scRNA_scripts/lib.R')
###### step1:导入数据 ######
# 付费环节 800 元人民币
#
ct=fread('../GSE225857_RAW/GSM7058754_immune_counts.txt.gz',data.table = F)
ct[1:4,1:4]
rownames(ct)=ct[,1]
ct=ct[,-1]
ct[1:4,1:4]
#ct=ct[,41:ncol(ct)]
print(dim(ct))
sce.all = CreateSeuratObject(counts = ct ,
min.cells = 5,
min.features = 300)
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all$orig.ident)
###### step2:QC质控 ######
dir.create("./1-QC")
setwd("./1-QC")
# 如果过滤的太狠,就需要去修改这个过滤代码
source('../scRNA_scripts/qc.R')
sce.all.filt = basic_qc(sce.all)
print(dim(sce.all))
print(dim(sce.all.filt))
setwd('../')
但是,这个数据集里面的髓系免疫细胞就不多,如下所示:
髓系免疫细胞就不多
想从里面搞出来中性粒细胞有一点难啊。通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45 ,PTPRC),
- epithelial/cancer (EpCAM ,EPCAM),
- stromal (CD10 ,MME,fibo or CD31 ,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。
我们前面已经对免疫细胞里面的髓系和B细胞细分亚群进行了简单的介绍:
- B细胞细分亚群
- 髓系免疫细胞细分亚群
但是之前的髓系免疫细胞细分的时候其实并没有中性粒细胞亚群,它也一直不在我们分享的单细胞数据处理代码里面。但是这次我参考了BD平台单细胞的优点都被你弄丢了,的查看中性粒细胞的特异性基因的方法, 如下所示:
查看中性粒细胞的特异性基因的方法
确实是,没有中性粒细胞的特异性基因高表达量的亚群啊!!!而且我反反复复看了看原文,就是2023的《Single-cell and spatial transcriptome analysis reveals the cellular heterogeneity of liver metastatic colorectal cancer》,里面的降维聚类分群结果里面也是没有展示中性粒细胞亚群哦!
没有展示中性粒细胞亚群
现在的问题来了
是因为bd平台比较容易捕获中性粒细胞呢,还是说取决于科研工作者的实验操作呢?
而且我在10x单细胞平台官网看到了它们也是可以通过调整数据分析参数找到里面的中性粒细胞的;https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/tutorials/neutrophils
所以如果大家还有自己的10x单细胞转录组的fastq数据文件,其实是可以试试看,重新分析一下就可以拯救里面的被之前的流程删除了的中性粒细胞啦 :
而且很明显可以看到,它是可以有很好的改善:
那么问题来了,前面的2023的《Single-cell and spatial transcriptome analysis reveals the cellular heterogeneity of liver metastatic colorectal cancer》,里面的降维聚类分群结果里面也是没有展示中性粒细胞亚群,也是可以通过fastq文件的重新处理抢救一下吗?
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
- 生物信息学马拉松授课(买一得五) ,你的生物信息学入门课
- 时隔5年,我们的生信技能树VIP学徒继续招生啦
- 144线程640Gb内存服务器共享一年仍然是仅需800
- 千呼万唤始出来的独享生物信息学云服务器
- 生信技能树知识整理实习生又又又开放申请啦(不招了,谢谢)
- 生信共享办公室出租