分享是一种态度
文章基本信息
题目:A single-cell and spatially resolved atlas of human breast cancers 期刊:NATURE GENETICS 发表时间:2021 单位:The Kinghorn Cancer Centre and Cancer Research Theme, Garvan Institute of Medical Research, Darlinghurst, New South Wales, Australia. 组织类型:乳腺癌 组学:scRNA, CITE-seq 测序平台:10X Genomics 样本数:26个原发肿瘤,11 ER , 5 HER2 , 10 TNBC 细胞数:130,246 数据链接:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE176078
背景知识
乳腺癌可以根据雌激素受体(estrogen receptor, ER)、孕激素受体(progesterone receptor, PR)的表达以及人表皮生长因子受体2(HER2)的过度表达或HER2基因ERBB2的扩增,分为三种广泛的亚型:luminal (ER ,PR /−);HER2 (HER2 ,ER /−,PR /−);和三阴性乳腺癌(TNBC;ER−PR−HER2−)。乳腺癌还根据使用PAM50分为五种“内在”分子亚型:luminal(LumA和LumB)、HER2富集(HER2E)、基底样basal-like和正常样normal-like。
临床医生根据PAM50的结果,进行诊断和治疗。而分子分型和临床分型有 70-80% 的一致性。
Luminal亚型通常与激素受体阳性乳腺癌相关,具有较好的预后;
Basal-like亚型通常与三阴性乳腺癌相关,具有较差的预后;
Normal-like亚型的乳腺癌在基因表达谱上类似于正常乳腺组织,具有较低的细胞增殖活性和较好的分化程度。(后面仅用 恶性cancer细胞做PAM50,因此没有鉴定到该亚型。)
CITE-seq ( cellular indexing of transcriptomes and epitopes by sequencing) 表面蛋白测序技术: 同时检测单细胞转录本与表面蛋白的新技术,实现了单细胞维度下的蛋白质信息与转录组信息的整合。
大群注释
主图:
共26原发肿瘤,包括11 ER , 5 HER2 和10 TNBC,共计130,246 个细胞。
a/b: 用经典的marker,注释为8个细胞类型。
c:每个样本,8个细胞类型的占比图。
附图:
将髓系细胞、基质细胞,再次降维聚类,不去除批次效应和数据整合。【without batch correction and data integration】
可以看出,不去除批次效应,免疫细胞也会表现出一定的样本特异性,但没有恶性细胞那么明显。
tips: 做免疫细胞亚群注释时,一般都会去除批次效应。
肿瘤细胞分群,基因集打分
BC起源于上皮细胞,对上皮细胞进行降维聚类,
主图:
d: 上皮细胞有很明显的样本异质性(不去除样本间批次效应);
e: 有3个群,包含多个样本、多个亚型的细胞,将其定为正常的上皮细胞;
three clusters contained cells from multiple patients and subtypes (Fig. 1d,e), which were identified as normal breast epithelial cells (Fig. 1f).
f: 对所有细胞进行inferCNV分析,根据CNV值,将细胞分为cancer/ normal/ unassigned 3种形式。
附图
g:所有样本,所有细胞的inferCNV结果,用的是全部的细胞。
Immune and endothelial cells were used to define the reference.
epithelial cells were classified into normal (nonneoplastic), neoplastic or unassigned using a similar method to that previously described by Neftel et al.30.
SCSubtype:利用scRNA数据 对样本进行“内在”分子亚型
将scRNA-seq数据,作为一个 pseudobulk数据,进行PAM50分型分析,同时利用TCGA数据集进行验证。得到一个可靠的鉴定不同细胞分型的基因集,但这个基因集仅有4个与PAM50中的50个基因有重复。
We constructed ‘pseudobulk’ profiles from scRNA-seq for each tumor and applied the PAM50 centroid predictor. identify 4 sets of genes that would define our
single-cell-derived molecular subtypes (89 genes, Basal_SC; 102 genes, HER2E_SC; 46 genes, LumA_SC; 65 genes, LumB_SC).
主图:
a:根据scRNA数据,得到用于分型的基因集;
b: scRNA分型结果,与临床分型的相似性。CID4471只有10%的恶性细胞,因此将其注释为Normal_Like亚型。
c: 用免疫组化,验证lumina 和 HER2亚型中,存在一定数量的Basal细胞。
CID4066和CID4290为ER , 但仍然对CK5 (basel like marker)免疫阳性,说明scRNA数据分型的准确性。
肿瘤细胞异质性分析
1、将>50个肿瘤细胞的样本,用seurat进行分组,并用MAST方法,得到每个cluster的DEG (有一定的过滤条件),得到每个cluster对应的200个基因的基因集。将所有样本的cluster 基因集,进行Jaccar similarity聚类,最终得到7个基因集Gene module,GM1 - GM7. 每个GM包括200个基因,Table S5中
For each individual tumor, with more than 50 neoplastic cells, neoplastic cells were clustered. MAST was then used to identify the top 200 differentially regulated genes in each cluster.
附图:
得到7个GMs并做了GSVA富集分析。
主图:
GM1-GM7的富集分析。
GM4 was uniquely enriched for hall marks of cell cycle and proliferation (for example, E2F_TARGETS, MKI67, PCNA and CDK1)
GM3 was epithelial–mesenchymal transition (EMT; VIM, ACTA2),
GM1 and GM5 showed characteristics of estrogen response pathways, (雌激素反应)
主图:
对每个恶性细胞进行GM1-GM7打分,并进行聚类分析。用SCSubtype 和GM得分,分析肿瘤内抑制性。
SCSubtype and GM analysis provide complementary new approaches to classifying neoplastic ITTH and provide further evidence that cancer cells
manifest diverse phenotypes within most tumors.
T/NK细胞降维聚类,细胞亚型注释
主图:
a/b: 对T/NK细胞进行降维聚类,得到18个cluster,注释到4个CD4 T, 5个CD8 T, NK, NKT, profilering等
c: CD8 T_LAG3为耗竭T, T_KI67, T_IFIT1为增殖,这3个细胞亚型,在TNBC中的比例,比ER /HER2 要高。
d: 对所有细胞亚型做 dysfunction 和 cytotoxic打分,
附图:
e: PDCD1/LAG3为免疫检查点,为Tex的marker,在TNBC中显著高表达。
CD70/CD27为配受体对,在T细胞活化和增殖起到重要作用。这里CD70/CD27的表达量高,与TNBC的特性相关,与前面GM4的表达趋势一致。
f: 用METABRIC中的bulk RNA进行分析,得到同样的结论。
对髓系细胞进行降维聚类,细胞亚型注释
主图:
a/b/c:对髓系细胞进行细胞亚型注释:cDC1, cDC2, pDC, LAMP3 _DC, 3个monocle, 1个M1-like, 2个M2-like, 2个脂类相关的 lipid-associated macrophage (LAM)
d/e: LAM1/LAM2在HER2 中,细胞比例显著低,且FABP5的预后差;
f: M2-like 的Macro高表达免疫检查点,从而降低T细胞的杀伤能力
附图:
f: 其他细胞亚型也做了统计分析,只有LAM1_FABP5在细胞类型间,有显著差异。
g: PD_L1/2在M2-like的macro中表达高。
对CAF/endo进行降维聚类,细胞亚型注释
主图:
a/b: 对CAF, PVL, Endo细胞分别进行降维聚类,并进行细胞亚型注释
a/b
附图:
a: 用Seurat将CAF, PVL (血管周围细胞,周细胞),Endo进行划分
b: 对CAF, PVL, Endo做monocle2 轨迹分析
c: 根据轨迹的分支,将CAF, PVL, Endo进行细胞亚型注释
t-SNE visualizations for CAFs, PVL cells and endothelial cells with monocle derived cell states overlaid.
对CAF进行轨迹分析
主图
用monocle2的state分群结果,作为细胞类型注释。论文中有CAF起始点的markers:
State 1 (referred to as s1 from this point onward) had features of mesenchymal stem cells (MSCs) and inflammatory-like CAFs (iCAFs), with high expression of stem cell markers (ALDH1A1, KLF4 and LEPR) and pathways related to chemoattraction and complement cascades (CXCL12 and C3)
附件:
CAF的轨迹分析,判断root的markers
对PVL/Endo做轨迹分析,并用CITE结果验证scRNA数据
e-g: 对PVL/Endo做轨迹分析,分别注释为3个细胞state,并用state命名,查看重要基因,随拟时序的变化轨迹
i/j: 用CITE的蛋白表达结果,验证scRNA的结果。
往期回顾
单细胞转录组学分析食管鳞状细胞癌生态系统
颈动脉粥样硬化进展的重要标志—脂相关蛋白NECTIN2
来源于多个物种的单细胞转录组表达量矩阵如何处理
BD平台单细胞的优点都被你弄丢了
端到端的单细胞管道SCP-细胞质控
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
- 生信入门&数据挖掘线上直播课11月班
- 时隔5年,我们的生信技能树VIP学徒继续招生啦
- 搭配GPU服务再升级—256线程2Tb内存服务器共享一年仍然是仅需800