【生信文献200篇】21 使用单细胞多组学探索TNBC病人的新辅助化疗疗效

2021-03-23 14:59:22 浏览数 (2)

0 文章信息

英文标题:Chemoresistance Evolution in Triple-Negative Breast Cancer Delineated by Single-Cell Sequencing

中文标题:单细胞测序揭示三阴性乳腺癌的化疗耐药性演变

期刊:cell

影响因子:36.216 发表时间:2018-05-03

研究领域:单细胞转录分析 耐药性研究 三阴性乳腺癌

DOI号:doi.org/10.1016/j.cell.2018.03.041

1 总述

三阴性乳腺癌是浸润性肿瘤,作者通过单细胞DNA和RNA测序,以及bulk exome测序,描绘了三阴性乳腺癌在基因组和转录组水平上的化疗耐药性的进化轨迹。分析结果表明:耐药基因型是预先存在的,并由NAC进行适应性选择,而TNBC患者的转录谱则是通过化疗后的重编程获得的。

Highlights

  • 化疗乳腺癌患者的单细胞测序;
  • 患者在治疗后表现出克隆持续或消失
  • 抗性是通过对预先存在的基因组畸变进行适应性选择而产生的
  • 化疗诱导的耐药信号的转录重编程

2 背景

三阴性乳腺癌:Triple-negative breast cancer,简称TNBC,是一种浸润性肿瘤,在乳腺癌中占比约为12%-18%。TNBC患者缺乏雌激素受体(ER)、前孕激素受体(PR)和HER2受体,不适合激素或抗HER2治疗。深度测序研究、多区域测序分析和单细胞测序研究表明,TNBC患者存在高水平的体细胞突变、TP53突变频繁(83%)和复杂的非整倍体重排(80%),导致大量的瘤内异质性(intratumor heterogeneity,ITH)。

TNBC患者治疗现状:治疗标准是新辅助化疗(NAC),包括紫杉烷类(有丝分裂抑制剂)和蒽环类(DNA插入剂)的联合治疗,大约30% - 50%的患者会产生耐药性。

3 主要流程

可以下载 :PRJNA396019 • SRP114962

下载metadata可以看到共 4847 TRANSCRIPTOMIC 单细胞转录组和 901 (其中829个单细胞,72个bulk的WES)GENOMIC数据,详情如下:

代码语言:javascript复制
1151 RNA-Seq  mid
1920 RNA-Seq  post #1487
2657 RNA-Seq  pre #2209
 275 WGS  midTX
 183 WGS  postTX
 371 WGS  preTX
  11 WXS  2cycleschemo
  21 WXS  blood
  19 WXS  operative
  21 WXS  pre

选择4个新辅助化疗受益及4个耐药的病人做单细胞测序,包括

  • single-cell DNA sequencing to analyze 900 cells
  • single-cell RNA sequencing to analyze 6,862 cells.

4 结果

4.1 TNBC Patients Treated with Neoadjuvant Chemotherapy

对TNBC患者进行新辅助化疗(NAC)

作者收集了20例进行NAC治疗的局部病变TNBC患者。

NAC治疗方案及实验设置:

  • 作者的核心活检是在0 cycles和2 cycle时进行的;手术样本是在6 cycles时获得的;
  • 对每个纵向时间点样本进行了三种实验程序

4.2 Clonal Extinction and Persistence of Mutations in Response to NAC

NAC诱导的克隆灭绝和持续突变

作者为了研究大量组织样的突变进化情况,对20例TNBC患者治疗前、治疗中及治疗后进行了外显子测序(平均深度180×);并且为了区分体细胞突变,对其匹配的血液样本进行了同样的测序(平均深度125×)。结果发现:TNBC患者TP53突变频率为60%,与TCGA结果一致。

  • 20例患者中,10例在治疗后无突变(图A),10例有残余突变(图B),但均无NAC引起的突变增加:

作者比较了治疗前后的突变等位基因频率(MAFs),并应用PyClone2和CITUP在拷贝数和纯度归一化后估计克隆亚群。

  • 其结果与Indel突变频率、组织切片及TheA的纯度估计结果一致。
  • 在克隆持续的患者中,NAC应答下降。

并且,作者还发现了对NAC产生的新突变(n=34):

但是,作者通过扩增子深度测序发现,S5表中的突变可能在治疗前样本中以非常低的频率存在。因此,作者提出了一个问题:治疗后检测到的新突变是否是由于获得性抗性自发诱导的,或者,治疗前存在非常低的频率,但由于外显子测序的覆盖深度有限(平均180×)而未检测到。

作者选择了一组治疗后突变明显的经预处理的bulk 肿瘤DNA进行靶向深度扩增子测序(平均深度167100×)。并应用DeepSNV检测突变等位基因的读计数是否比匹配正常样本的背景错误率有统计学意义(p<0.05)。

扩增子数据显示,多数新突变在治疗前的肿瘤中确实以低频率发生(范围为0.02%至2%),这与调整性耐药一致(图2E)。然而,在P19中,与匹配的正常样本相比,新生突变在统计学上并不显著(图2F)。该患者的突变可能是在肿瘤细胞接受化疗后重新产生的,也可能是由于测序深度不够或从不同的空间区域取样而未取样。

4.3 Copy-Number Evolution and Clonal Extinction in Response to NAC

NAC对拷贝数变异和克隆消失的响应

为了研究NAC对拷贝数的影响,作者选择了8例TNBC配对患者纵向样本的900个单个细胞进行了单核测序。

  • 根据外显子组数据选择了4名克隆消失的患者(P1,P2,P6,P9)和4名克隆持续的患者(P11,P12,P14,P15)进行分析。

通过FACS从aneuploid-gated分布中分离出单个核,并进行稀疏(0.1×)全基因组测序量化基因组拷贝数。

对DAPI染色细胞的FACS分析显示,4个克隆持续患者在治疗前后的样本中均存在非整倍体分布,而4个克隆消失患者在治疗后存在低或无法检测到的非整倍体分布(图S1)。

作者对4个克隆消失的患者进行最佳聚类和t-SNE映射。该分析在每个患者中发现了2到3个非整倍体肿瘤细胞簇和一个正常二倍体细胞簇。并且非整倍体簇只出现在治疗前的组织中,二倍体簇主要出现在治疗后的组织中。

接下来,作者计算每个亚克隆的一致整数拷贝数分布,使用最大简约推断克隆谱系。并且通过Timescape进行可视化。(S2A)

这些数据在3例患者(P2,P6,P9)中确定了两个主要克隆,在治疗前肿瘤的第4例患者(P1)中确定了三个主要克隆。

共识图谱(Consensus profiles)显示,多克隆肿瘤具有共同的进化祖先(由共同的CNAs可得):

4.4 Adaptive Copy-Number Evolution in Response to NAC

对NAC响应的自适应拷贝数变异

为了描述4个克隆持续患者的拷贝数进化,作者检测了2到5个非整倍体肿瘤细胞拷贝数分布(图4A),并构建了最大简化树(图S2B)。

作者发现在4例患者中,少数治疗前的肿瘤细胞(箭头)与治疗后的肿瘤细胞聚集在一起,表明他们共享一个耐药基因型。

为了鉴定耐药相关克隆中的特异性CNAs,作者计算了单个细胞的一致性拷贝数分布。(4B-4E)

4.5 Transcriptional Programs of Tumor Cells in Clonal Extinction Patients

克隆灭绝患者肿瘤细胞的转录程序

作者利用高通量纳米网格单核RNA测序(SNRS)研究了NAC产生的表型变化。作者对4个克隆消失患者的500个单核进行SNRS,平均每个细胞得到120万reads和4107个基因。

作者以240个二倍体正常乳腺细胞作基准,将细胞分为正常基质细胞和非整倍体肿瘤细胞。聚类热图结果与单细胞拷贝数结果一致。

作者使用MAST检测了治疗前肿瘤细胞和治疗后样本上皮细胞之间的差异表达基因。作者处理了单细胞基因检测率引起的批量效应,并进行高维分析,以确定治疗后是否存在肿瘤细胞(图5B)。

为了确定批效应回归是否影响生物信号,作者比较了校正和未校正的数据集,并发现差异表达基因的一致性很高(72–99%)(图S3A)。

作者预测了乳腺癌的内在分子亚型,并发现4个TNBC患者都以肿瘤细胞的基底样亚型为主;但每个肿瘤中也有少量肿瘤细胞具有其他亚型特征(图S3B)。

对差异表达基因进行聚类显示,肿瘤细胞中的一些基因(NRA,MYC,FGFR2,TP53),在治疗后样本中相对于正常上皮细胞(平均530个基因)上调(图S4A)。12个已知的肿瘤基因在所有克隆消失患者中都上调了(图5C)。

为了确定肿瘤表型是否在TNBC患者中共享,作者进行了基因集变异分析(GSVA),并对一组肿瘤特异性特征进行聚类。

基因特征分析还显示治疗前肿瘤细胞增殖和凋亡增加(图S4B和S4C)。这些基因和通路可能在克隆消失患者对化疗的敏感性中发挥潜在作用。

作者将四名患者的所有肿瘤和正常细胞RNA数据结合起来,用t-SNE对基因特征进行高维分析(图5E)。

结果表明,正常细胞和肿瘤细胞形成两个不同的簇,并且结果无批次效应影响。在治疗后样本的正常细胞簇中,我们发现高水平的成纤维细胞标记物ACTA2,并在治疗前样本的肿瘤细胞簇中,发现了高水平的上皮标记物EPCAM(图5F)。

作者进一步用细胞类型特异性标记物将治疗后样本中的所有正常细胞按八种主要乳腺细胞类型进行分类,结果显示成纤维细胞是NAC后最丰富的细胞类型(平均51.1%±14.9%SD),其次是其他细胞类型,如T细胞(平均6.9%)和其他CD45 免疫细胞(图5G)。

4.6 Acquired Transcriptional Reprogramming of Chemoresistant Tumor Cells

耐药肿瘤细胞的获得性转录重编程

为了研究克隆持续患者的表型变化,作者进行了SNRS检测,并用单细胞数据计算拷贝数分布,进行聚类分析(图6A)。

结果发现,与克隆消失患者相比,治疗前后样本中均检测到大量非整倍体细胞(85%-99%),与单细胞拷贝数数据一致。

为了确定在治疗前肿瘤中是否存在低频率的具有耐药表达谱的肿瘤细胞,作者进行了高维分析(图6B)。

在三例患者(P15,P14,P11)中,作者没有检测到任何预先存在的转录谱与治疗后肿瘤细胞聚集。

为了确定治疗后化疗耐药肿瘤细胞中上调的基因,作者使用MAST进行了差异表达分析,并在每个患者中确定了59-275个差异表达基因(图6C)。一些重要基因包括已知的癌症基因(MYC,ERBB3,KIT和PIK3R1),在TNBC中没有重复出现(图6C)。

分子亚型显示肿瘤有许多基底样细胞,除了P12,其许多肿瘤细胞被分为HER2富集型、管腔A型和管腔B型(图S3C),但没有FISH的拷贝数扩增(表S1)。这些数据表明,单个细胞的亚型组成并没有因NAC而发生显著变化,这表明转换没有发生亚型(图S3C)。

为了确定化疗耐药肿瘤细胞的常见表型,作者使用GSVA对一组与癌症相关的特征进行单细胞基因特征分析,并将4名患者的标准化得分聚集在一起(图6D和6E)。

  • GSVA分析结果表明,基因信号在NAC后耐药肿瘤细胞中都是上调的(图6D)。
  • t-SNE聚类结果表明:治疗前后的肿瘤细胞被分为两个不同的簇(图6E)。在高维图中标记了单细胞的化疗耐药基因特征评分,并发现在治疗后样品中高度富集(图6E)。

对从接受化疗并有长期临床随访数据的乳腺癌患者的METABRIC队列中选出的412名患者进行生存分析:

作者使用METABRIC中接受化疗的乳腺癌患者(n=412),结合基因表达数据和长期临床随访数据,确定化疗耐药相关特征是否与患者生存相关。

  • 分析表明,两个信号(AKT1信号和缺氧)与更差生存显著的统计学意义(P<0.05)(图S5)。

作者通过整合单细胞DNA和RNA数据集来研究化疗耐药基因的亚群是否在治疗前的单细胞中表达。

  • 确定RNA拷贝数谱中是否存在单细胞DNA抗性克隆中的亚克隆CNAs,以将每个细胞分为抗性或敏感基因型。
  • 质控:使用SAVER补单细胞RNA数据中缺失的值。
  • 将治疗后肿瘤中具有耐药基因型的肿瘤细胞与治疗前肿瘤中的敏感基因型进行比较,使用MAST以获得可变基因。
  • 通过随机森林回归和分类,我们定义了治疗前肿瘤中表达部分化疗耐药基因的“启动细胞”。

在P11,P12,P14中检测到少量的治疗前细胞表达了化疗耐药基因的子集(图S6A和S6B)。

启动肿瘤细胞的频率低于已存在的化疗耐药单细胞的拷贝数谱,这表明单独的CNAs不足以赋予肿瘤细胞的完全抗性表型。

作者最后整合了外显子突变和3’单细胞RNA数据集,以确定在mRNA转录物表达的最后一个外显子中是否可以识别表达突变。

该分析表明,仅在克隆消失患者的治疗前单细胞RNA数据中检测到表达突变,而克隆持续性患者在治疗前后单细胞RNA数据集中均显示表达突变。

5 延伸

5.1 外显子组测序(WES)

外显子组测序(Whole Exome Sequencing,WES)是利用探针杂交富集外显子区域的DNA 序列,然后通过高通量测序,主要识别和研究与疾病、种群进化相关的的编码区及调控区域(Untranslated Regions ,UTR)相关遗传突变的技术手段。

https://mp.weixin.qq.com/s/EeKdBKQ5Va6A0ZgR7muykA

WES的分析过程:

  • Raw fastq QC(质控)
  • Alignment(比对)
  • Germline variants calling(胚系突变流程)
    • Create exon interval bed文件
    • BQSR
    • HaplotypeCaller & Joint genotype
    • VQSR
  • Somatic Variants Calling(体细胞突变流程)
    • Create PoN
    • Mutect2 calling
  • annovar注释
  • somatic的可视化结果

5.2 PyClone2

对存在异质性的肿瘤来说,多次不同部位取样,或者不同时间取样,那么虽然说是同一个肿瘤病人,他们不同的测序结果理论上不一致的, 那么pyclone就可以分析出来,同一个病人的不同测序数据里面共有哪些亚克隆。

https://mp.weixin.qq.com/s/cfrWx8rRSu187qt-fCFvVw;

https://mp.weixin.qq.com/s/f7uk-u25_YSIst7DIMHGSQ

需要对癌症的不同时期(时间)或对不同位置(空间)进行取样测序,检测突变,根据突变的位置、频率和拷贝数信息进行聚类和进化分析。目前常用的方法工具(pyclone,citup,fishplot等)

https://mp.weixin.qq.com/s/9q7Sw02Ujfv0mA8YxxY5ag

5.3 利用 Timescape 做肿瘤进化鱼图

https://mp.weixin.qq.com/s/sY9UGew-61OV3-xw6-MHQg

画一个鱼图,需要用到的工具是 citup 和 Timescape;

CITUP 全称 Conality Inference in Tumors Using Phylogeny,是一种使用系统发育论进行肿瘤的克隆推断生物信息学工具,可用于从单个患者获得的多个样本来推断肿瘤异质性。给定每个样本的突变频率,CITUP 使用基于优化的算法来找到最能解释数据的进化树。

  • 需要准备两个文件,一个是突变位点在不同样本的突变频率,行是突变位点,列是样本。另一个是突变的 cluster,只有单列,记录每个突变位点所在的 cluster 。两个文件的突变位点顺序要一致。
  • 得到的 cellfreq.txttree.txt 这两个文件,前者行表示样本,列表示克隆 clusters,每个值代表克隆频率。后者表示的是进化树的克隆分支关系

进一步处理成 Timescape 的 input 了,处理的方法是:tree.txt 不用做修改,cellfreq.txt 需要被处理为3列 time or space ID, the clone ID, and the clonal prevalence。

0 人点赞