Nature Communication:Claudin-low亚型乳腺癌的综合特征分析揭示细胞起源对肿瘤进化的影响

2022-03-29 14:40:09 浏览数 (2)

导语

GUIDE ╲

Claudin是细胞间紧密连接的骨架蛋白,参与维持紧密连接的各种功能,异常表达可破坏上皮细胞及内皮细胞的结构,导致其功能严重受损。Claudin-low型乳腺癌是一种侵袭性肿瘤,其特征是细胞连接的关键成分低表达,与间质和干细胞性特征相关,但其组织起源仍不清楚。

本研究表明,这种分子亚型乳腺癌表现出显著的多样性,包括从独特的进化过程中产生的三个主要的亚群。

背景介绍

乳腺癌是一种高度异质性的疾病,其生物学和临床表现多种多样。基因表达谱分析鉴定四种临床相关的分子亚型(基底样,富含HER2的,管腔A,管腔B和正常样)。在这些内在亚型中,基底样亚型是最明显的,其特征是细胞角蛋白在皮肤的基底层独特表达、管腔相关基因表达水平非常低。由这一观察结果产生了一种假设,即乳腺癌可能是两种不同类型细胞或不同乳腺上皮细胞发育阶段的转变而产生的,一种产生基底样肿瘤,另一种产生非基底样恶性肿瘤,但该模型忽略了在肿瘤发展过程中由致癌事件或微环境信号引发的谱系限制性群体的潜在重组过程。此外它没有考虑到每个乳腺癌亚型的内在多样性。另外一种乳腺癌的内在亚型—claudin-low,表现出与基底样亚型的一些共同特征,反映了管腔低分化状态的肿瘤多样性。TNBCs以基底样和 claudin-low亚型为主。claudin-low亚型的一个标志是关键细胞黏附分子表达水平低(包括claudins 3/4/7,occludin,E-cadherin)。这种亚型在间质特征和干细胞特征中高度富集,被认为是最原始的乳腺癌。虽然体内临床前数据表明基底样亚型是由管腔祖细胞转化而来,但claudin-low亚型的细胞来源仍不清楚。普遍的假设是,①在癌进展过程中,基底癌细胞发生EMT,以应对获得性致癌事件和/或微环境信号,从而获得间质和干细胞性特征;②假设claudin-low亚型起源于具有固有干细胞性特征的早期上皮细胞前体。分析claudin-low亚型的基因组结构表明,成熟的管腔细胞和管腔祖细胞在癌基因驱动下发生转化,引发大量的癌基因诱导的DNA损伤和早期的染色体不稳定(CIN),正常的人乳腺干细胞可以耐受异常的有丝分裂活动。通常基底样乳腺癌表现为大量的基因组畸变,因此推测基因组畸变的程度可用作claudin-low乳腺癌亚型发育起源的分子指标

结果解析

01

Claudin-low亚型样本筛选

与其他乳腺癌亚型相比,claudin-low有明显的免疫和基质细胞浸润。由于基因表达分析不能准确区分间充质癌细胞和正常间质细胞,我们使用基于拷贝数的肿瘤纯度估计方法ASCAT评估肿瘤细胞的比例。为避免因非肿瘤细胞污染而造成的严重偏差,应用Wilcoxon检验确定了严格的阈值,45/152个METABRIC样本为claudin-low亚型。

02

CNA缺乏的claudin-low亚型识别

使用基于基因表达和CNA的分层分析claudin-low(Fig. 1a)。基底样多属于整合性聚类10,以多个CNAs影响大多数染色体为特征,claudin-low肿瘤被分三个主要聚类,显示出显著的异质性。聚类4包括ER阳性和ER阴性病例,定义为一个CNA缺乏的亚群,其表达谱以免疫相关基因为主。我们分析了基因组缺失区域的SNPs的B等位基因频率(BAF)和log R比,鉴定出单拷贝等位基因缺失区域(Fig. 1b),显示了BAF值之间的明确分隔(<0.8和>0.2)。体细胞突变的分析突出了几个点突变的变异等位基因频率高于0.4(Fig. 1c)。明确地证明了在缺乏总体CIN的情况下,claudin-low亚型存在

Fig. 1 Claudin-low分布于luminal-like IntClust3,basal-like IntClust10,CNA-devoid IntClust4,具有罕见的局灶性基因组改变。

03

Claudin-low亚型的基因组多样性

尽管大多数claudin-low亚型是二倍体 (Fig. 2a),但整个肿瘤的FGA(fraction of genome altered)程度高度可变 (Fig. 2b),证实其内在多样性。使用Gaussian finite mixture models揭示了一个三模态分布,存在claudin-low肿瘤的三个亚组(Fig. 2c,d)。

Fig. 2 Claudin-low在基因和分子层面的异质性亚组。

04

Claudin-low亚组的基因表达特征

GSEA识别三个claudin-low亚组两两之间的差异调控通路,总共分析了超过1500个通路(Hallmarks,KEGG,REACTOME,BIOCARTA,GO,MSigDB)。分析结果:①干细胞相关特征在CL1富集;②管腔相关特征在CL2中富集;③细胞周期相关通路在CL3中富集(Fig. 3a)。ssGSEA分析确定三个claudin-low亚组的分化情况,与GSEA分析一致。

Fig. 3 Claudin-low亚组表现出与分化状态相关的明显基因表达特征。

05

构建基于基因表达的分类器

用the nearest shrunken centroid method构建了一个基于基因表达的分类器,来区分claudin-low亚组。建立了鉴别3个亚组的claudin-low基因列表(137 genes)。相比于使用Gaussian finite mixture models基于FGA分类,基于表达的分类器有91%准确率。然后将分类器应用于claudin-low样本(TCGA和CCLE),并以FGA水平作为读数,验证各claudin-low亚组的特征,CL1、CL2和CL3和细胞系的FGA水平分别为低、中、高。

06

Claudin-low亚组的不同甲基化谱

在claudin-low亚组中进行差异甲基化基因分析和通路富集分析,CL1有40个差异甲基化基因,其中75%的基因低甲基化并且在干细胞和EMT通路富集(Fig. 4a)。CL2包含68个差异甲基化基因,其中88%高甲基化在基底样和EMT通路中富集(Fig. 4b)。CL3有219个差异甲基化基因,58%为高甲基化,与管腔通路相关;42%为低甲基化,与基底样通路相关(Fig. 4c)。为了将这些不同的基因甲基化谱与基因表达相关联,对三个claudin-low亚组以及来自METABRIC、TCGA、CCLE的乳腺癌内在亚型中的干细胞和EMT基因标记进行了基因表达分析。CL1在干细胞和EMT相关基因方面得分最高,而CL2/CL3与CL1和相对的管腔/基底肿瘤相比,表现为中等得分

Fig. 4 Claudin-low亚组显示了与分化状态对应的不同的基因甲基化情况。

07

Claudin-low亚组的不同致癌通路

对来自METABRIC和TCGA的乳腺癌样本,计算所有MSigDB hallmark基因集特征的ssGSEA评分。每个亚组中基于每一个(共48个)生物过程的中位数进行无监督聚类。在两个数据集中,三个亚组都聚集在一个特定区域。在所有亚组特异性富集的通路中,有一些与免疫功能相关,支持了claudin-low肿瘤微环境中免疫细胞浸润的假说。与所有其他亚型相比,CL1在claudin-low相关通路中富集程度最高(Fig. 5)。

对Fig. 5中识别的通路计算ssGSEA评分,并且使用TCGA的RPPA数据在蛋白水平上分析了相同的通路。与之前的结果相同,三个claudin-low亚组中,CL2和CL3分别在管腔和基底样特征的得分最高。此外,CL2和CL3均有EMT激活,荷尔蒙下调(CL2)和增殖/DDR(CL3)特征(Fig. 6a,b,g)。CL1的增殖活性较低,DDR较低,且较强的TP53信号通路特征与的TP53低突变频率相关(Fig. 6c, d, g),还表现出对RAS-MAPK信号通路的较高的激活活性(Fig. 6e-g)。与非claudin-low细胞系相比,claudin-low细胞系对MEK抑制剂明显更敏感(Fig. 6h)。

CL1亚群与正常的MaSCs(人乳腺干细胞)相关,CL2与正常的mL(成熟管腔细胞)和管腔乳腺癌相关,CL3与基底样乳腺癌相关。CL3与较低的总生存率和无病生存率有关,CL1预后良好

Fig. 5 Claudin-low亚组不同的生物学通路。

Fig. 6 Claudin-low亚组共同表现出高EMT特征和MAPK通路激活。

DDR:DNA damage response.

小编总结

METABRIC和TCGA数据库的综合特征分析揭示了claudin-low乳腺癌的存在。通过三个主要分子亚组的比较描述了claudin-low乳腺癌的内在多样性特征,这些亚组与不同的生存结果相关。

文中用到的数据和方法:

(1) 数据

乳腺癌样本:METABRICTCGA,细胞系CCLE

临床数据(包括三阴性状态):METABRIC的Synapse平台,TCGA的GDC/ cBioPortal

ASCAT的倍性和纯度估计—COSMIC

每个基因的归一化甲基化值—cBioPortal。

RPPA level 4数据— the cancer proteome atlas portal

为MEKi预测的IC50数据—GDSC

(2) 方法

绘制热图ComplexeHeatmap,PCA分析ade4,建立Gaussian finite models模型mclust and Rmixmod,生存分析survival ,综合聚类和乳腺癌分子亚型归类genefu,通路富集分析msigdbr,GSEA分析fgsea,基因列表预排秩Signal2Noise metric,计算ssGSEA分数gsva,芯片数据标准化oligo,差异表达limma,使用shrunken nearest centroid method基于表达的亚组分类器pamr,肿瘤微环境中免疫和非免疫细胞组分的估计ImmunedeconvXcell and MCPCounter

0 人点赞