文章概述
文章标题:《Dissecting esophageal squamous-cell carcinoma ecosystem by single-cell transcriptomic analysis》
发表日期和杂志:2021年发表在Nature Communications上
在线阅读链接:https://doi.org/10.1038/s41467-021-25539-x
ESCC——食管鳞状细胞癌简介
食道癌是全球第六大癌症相关死亡原因,食管鳞癌占食道癌总数的90%以上。
食管鳞状细胞癌是一种常见的食管癌类型,主要发生在食管的鳞状细胞中。这种类型的癌症通常与吸烟、饮酒、不良饮食习惯(如过度食用热的、硬的或粗糙的食物)和某些病症(如食管炎、食管裂孔疝等)有关。
食管鳞状细胞癌的症状可能包括困难吞咽(尤其是固体食物)、胸痛、体重减轻、嗳气、咳嗽、声音嘶哑等。然而,早期的食管鳞状细胞癌可能没有明显的症状,因此,当症状出现时,癌症可能已经进展到较晚的阶段。
食管鳞状细胞癌的诊断通常包括内窥镜检查、活组织检查(病理学检查)和影像学检查(如CT扫描、MRI等)。治疗方法可能包括手术、放疗、化疗或者是这些方法的组合。预后因个体差异、癌症阶段和治疗反应而异,但总体来说,食管鳞状细胞癌的五年生存率相对较低。
实验设计
基于来自60个个体的208,659个单细胞转录组研究ESCC肿瘤的组成。
从恶性上皮细胞中鉴定出8种常见的表达程序,发现肿瘤微环境中42种细胞类型,包括26种免疫细胞和16种非免疫基质细胞亚型,并分析了肿瘤微环境中癌细胞与其他细胞的相互作用以及不同细胞类型之间的相互作用。
单细胞转录组数据情况
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE160269
利用10X Genomics 平台对60例食管癌组织和4例癌旁正常组织标本进行了scRNA-seq分析
提供了UMIs.txt.gz格式的单细胞数据txt.gz格式文件,直接下载之后使用fread函数读取
数据下载导入,进行整理后再创建Seurat对象:
代码语言:javascript复制###### step1:导入数据 ######
library(data.table)
Sys.time()
raw.data <- fread( 'GSE160269_CD45neg_UMIs.txt.gz',
data.table = F)
Sys.time()
dim(raw.data) #
raw.data[1:4,1:3]
rownames(raw.data)=raw.data[,1]
raw.data=raw.data[,-1]
head(colnames(raw.data))
library(stringr)
metadata <- as.data.frame(str_split(colnames(raw.data),'[-]',
simplify = T))
head(metadata)
table(metadata[,1])
table(metadata[,2])
metadata=metadata[,c(1,3)]
colnames(metadata)=c('orig.ident' ,'barcode')
#metadata$orig.ident=paste0('p',metadata$orig.ident)
table(metadata$orig.ident)
rownames(metadata) = colnames(raw.data)
identical(rownames(metadata),colnames(raw.data))
sce.all <- CreateSeuratObject(counts = raw.data)
sce.all <- AddMetaData(object = sce.all, metadata = metadata)
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all@meta.data$orig.ident)
后面就是标准分析啦,对读取进来的数据分别进行质控、harmony整合以及细分亚群定义等。
第一层次降维聚类分群
文章在质控后,保留了208,659个细胞的单细胞转录组,其中97,631个CD45−和111,028个CD45 细胞。在对读取深度和线粒体读取计数进行回归之后,对组合的CD45−和CD45 数据集进行了基于图形的聚类,并使用已建立的标记基因对聚类进行了注释.
确定了8个主要的细胞群:CD45− dataset:
- epithelial cells
- fibroblasts
- endothelial cells
- pericytes
- fibroblastic reticular cells (FRC)
CD45 dataset:
- T cells
- B cells
- myeloid cells
并且通过对52例上皮细胞数>100的肿瘤组织的转录组分析,将其分为38个簇
其它加分项
对主要亚群如T细胞、髓系细胞等进行亚群细分。
T细胞的亚群分析得到9种不同的T细胞亚型,与正常组织相⽐,ESCC富含调节性T细胞和耗竭T细胞,但缺乏初始T、记忆T和效应T细胞,
髓系细胞的亚群分析得到11个亚型,其中DC(tDC)具有最⾼的PD-L1和PD-L2的表达,并且PD-L1和PD-L2在ESCC中表达更⾼,这提示tDC可能参与免疫逃避。
周细胞、成纤维细胞的亚群分析得到9个亚型,与正常组织相⽐,ESCC富含CAF2、CAF3、CAF4和周细胞,其中CAF3 、CAF4表现出肌成纤维细胞标志基因,⽽肌成纤维细胞可促进肿瘤侵袭和转移。
文章同时进行了生存分析验证
文章剖析了恶性上皮细胞中8个常见的表达程序,将TME组成分解为42个功能亚型,其中包括26个免疫细胞亚型和16个非免疫基质细胞亚型。还阐明了癌细胞与TME细胞之间可能的相互作用以及TME中不同细胞类型之间的相互作用,以及ESCC生态系统成分与基因组改变或疾病结果之间的关系。