文章概述
文章标题:《Evolution of core archetypal phenotypes in progressive high grade serous ovarian cancer》
发表日期和杂志:2021年发表在Nature Communications上
在线阅读链接:https://doi.org/10.1038/s41467-021-23171-3
实验设计
为了了解在治疗前和通过适应治疗之前驱动异质性的因素的选择,对治疗期间纵向收集的HGSOC肿瘤的单细胞RNA测序(scRNA-seq)转录本进行了分析,分析了来自两个独立患者队列的scRNA-seq数据。
对恶性液体样本进行处理以去除免疫细胞和凋亡细胞,并进行全基因组测序,体外代谢测定和scRNA-seq处理。
HGSOC简介
高级别浆液性卵巢癌(High-Grade Serous Ovarian Cancer,HGSOC)是最常见的卵巢癌类型,也是最致命的妇科癌症之一。它通常在晚期才被发现,因为早期症状往往不明显或被忽视。
HGSOC的特点是快速生长和扩散,以及对化疗的初期反应良好,但往往会发生复发和对治疗产生抗性。大多数HGSOC患者在诊断时已经处于晚期,疾病已经扩散到盆腔以外的其他部位。
HGSOC的治疗通常包括手术和化疗。手术目的是尽可能多地移除肿瘤,化疗则用于杀死残留的癌细胞。尽管这种治疗方法可以延长患者的生存时间,但大多数患者最终还是会复发。
HGSOC的研究正在不断进展,包括寻找新的治疗方法,如免疫疗法和靶向疗法,以及更好的早期检测方法。然而,HGSOC的预后仍然很差,因此需要更多的研究来改善患者的生存率和生活质量。
单细胞转录组数据情况
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE158722
文章给的单细胞RNA测序数据一共是24个数据集,提供了count.txt.gz格式的下载文件,直接下载之后使用fread函数读取
代码语言:javascript复制GSE158722_P01.counts.txt.gz 3.1 Mb (ftp)(http) TXT
GSE158722_P02.counts.txt.gz 2.5 Mb (ftp)(http) TXT
GSE158722_P03.counts.txt.gz 3.2 Mb (ftp)(http) TXT
GSE158722_P04.counts.txt.gz 42.0 Mb (ftp)(http) TXT
GSE158722_P05.counts.txt.gz 37.0 Mb (ftp)(http) TXT
GSE158722_P06.counts.txt.gz 12.7 Mb (ftp)(http) TXT
GSE158722_P07.counts.txt.gz 44.0 Mb (ftp)(http) TXT
GSE158722_P08.counts.txt.gz 46.6 Mb (ftp)(http) TXT
GSE158722_P09.counts.txt.gz 28.3 Mb (ftp)(http) TXT
GSE158722_P10.counts.txt.gz 2.7 Mb (ftp)(http) TXT
GSE158722_P11.counts.txt.gz 13.3 Mb (ftp)(http) TXT
GSE158722_P12.counts.txt.gz 14.6 Mb (ftp)(http) TXT
GSE158722_P13.counts.txt.gz 9.6 Mb (ftp)(http) TXT
GSE158722_P14.counts.txt.gz 13.6 Mb (ftp)(http) TXT
GSE158722_P15.counts.txt.gz 11.1 Mb (ftp)(http) TXT
GSE158722_P16.counts.txt.gz 15.4 Mb (ftp)(http) TXT
GSE158722_P17.counts.txt.gz 15.9 Mb (ftp)(http) TXT
GSE158722_P18.counts.txt.gz 9.5 Mb (ftp)(http) TXT
GSE158722_P19.counts.txt.gz 9.3 Mb (ftp)(http) TXT
GSE158722_P20.counts.txt.gz 10.2 Mb (ftp)(http) TXT
GSE158722_P21.counts.txt.gz 21.5 Mb (ftp)(http) TXT
GSE158722_P23.counts.txt.gz 13.9 Mb (ftp)(http) TXT
GSE158722_P24.counts.txt.gz 14.3 Mb (ftp)(http) TXT
数据下载导入,并创建Seurat对象:
代码语言:javascript复制###### step1:导入数据 ######
library(data.table)
library(data.table)
dir='GSE158722_RAW/'
samples=list.files( dir ,pattern = 'gz')
samples
library(data.table)
sceList = lapply(samples,function(pro){
# pro=samples[1]
print(pro)
ct=fread(file.path( dir ,pro),data.table = F)
ct[1:4,1:4]
rownames(ct)=ct[,1]
ct=ct[,-1]
ct=ct[,-1]
sce=CreateSeuratObject(counts = ct ,
project = gsub('.counts.txt.gz','',
strsplit(pro,'_')[[1]][2]),
min.cells = 5,
min.features = 300,)
return(sce)
})
names(sceList)
library(stringr)
samples=gsub('.counts.txt.gz','',str_split(samples,'_',simplify = T)[,2])
samples
names(sceList) = samples
sce.all=merge(x=sceList[[1]],
y=sceList[ -1 ],add.cell.ids = samples[1:3])
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群定义等。
第一层次降维聚类分群
文章中对数据进行CCA标准化后,使用iCell8(患者1-3)或10X(患者4-9)scRNA-seq平台对整合的高质量细胞进行均匀流形近似和投影(UMAP)和聚类分析
检测到较小但不同的免疫细胞簇,包括单核细胞和巨噬细胞(簇3)、CD4 /CD8 T细胞(簇4)、成纤维细胞(簇5)和自然杀伤(NK)细胞(簇6)。
~27K细胞被鉴定为恶性上皮细胞,分布在多个集群中,反映了种群内的异质性
通过BioinfoArk提供的中国区chatGPT查询到malignant epithelial cells的解释:
- 恶性上皮细胞是指发生了恶性变化的上皮细胞。上皮细胞是覆盖在身体表面和内脏器官表面的细胞,也构成了许多腺体。当这些细胞发生基因突变并开始无控制地增长和分裂时,就可能形成恶性肿瘤,也就是癌症。
- 恶性上皮细胞是许多类型癌症的来源,包括肺癌、乳腺癌、前列腺癌、结肠癌、卵巢癌等。这些癌症通常被称为癌症或上皮性肿瘤。
- 恶性上皮细胞的特点包括形态异常、增长速度快、侵袭性强和易于转移。这些细胞可以通过血液或淋巴系统扩散到身体的其他部位,形成转移瘤。
其它加分项
来自整合的纵向队列的细胞被投影到scRNA-seq数据的前两个主成分上,使用Pareto任务推理算法识别的每个顶点代表一个专门用于特定生物任务的原型。
文章揭示了HGSOC是由三种原型表型驱动的,这三种原型表型被定义为描述大多数转录组变异的致癌状态。发现新陈代谢和增殖的变化与HGSOC的治疗反应和克隆异质性有关。