TCGA和METABRIC的TNBC病人数量到底是多少

2020-02-20 14:50:20 浏览数 (1)

因为自己博士课题是关于乳腺癌肿瘤异质性的研究,所以对这个癌症的背景知识稍微多一点。顺理成章的我出的大量学徒作业也是关于乳腺癌的,其中乳腺癌里面最恶性的就是TNBC,或者说三阴性乳腺癌啦。看到了不下50篇TNBC相关数据挖掘文章,基本上都是TCGA或者METABRIC数据库啦,但是不同文章对TNBC定义有冲突,而且样本数量都不一致,很是尴尬!

The traditional classification of BC has utilised tumour morphology and assessment of oestrogen receptor [ER], progesterone receptor [PR] and human epidermal growth factor receptor 2 (HER2) expression.

乳腺癌通常根据分子分型分成4类:

  • 管腔A型(ER阳性,PR≥20%,HER2阴性,Ki-67<20%)
  • 管腔B型(ER阳性,PR<20%和/或HER2阳性和/或Ki-67≥20%)
  • HER2过表达型(ER阴性,PR阴性,HER2阳性)
  • 基底样型(ER阴性,PR阴性,HER2阴性)

因为分子分型临床应用还是有一定难度,所以IHC检测结果的TNBC通常是代替基底样型,而大量的公共数据库也会记录患者的ER,PR,HER2的IHC结果,比如TCGA和METABRIC的乳腺癌病人。但是这两个数据库里面到底是TNBC病人多少个呢?

比如一个摘要就提到:TNBC samples obtained from both TCGA (N = 150) and METABRIC (N = 320) datasets,链接是:https://ascopubs.org/doi/abs/10.1200/JCO.2019.37.15_suppl.1073?af=R

而发表于 Annals of Oncology, April 2018,的文章, 链接是,https://doi.org/10.1093/annonc/mdy024 主要是下载两个数据库总共 (n = 550) 的TNBC病人的数据进行分析

这样的数据挖掘文章太多了,而且大家的结论一致性并不好,首先就是TNBC样本数量的不一致,你试试看吧?

TNBC的分子分型

TNBC是最恶性的乳腺癌,本身也是可以继续分类,分子分型的研究不少了:

  • 首先是2011的meta分析,J Clin Invest. 2011 Jul; 把TNBC分成6类:Basal-like 1 (BL1), basal-like 2 (BL2), immunomodulatory (IM), mesenchymal (M), mesenchymal stem-like (MSL) and luminal androgen receptor (LAR)
  • 然后同样的作者,PLoS One. 2016 Jun 16;发文重新修订了 之前的分类,变成4类:(TNBCtype-4) tumor-specific subtypes (BL1, BL2, M and LAR)
  • 发表在:Clin Cancer Res. 2015 Apr ,题目是 Comprehensive Genomic Analysis Identifies Novel Subtypes and Targets of Triple-Negative Breast Cancer,贝勒医学院研究小组的 Burstein 等人对自己的数据,198个TNBC病人芯片表达矩阵,使用80个核心基因进行分组,得到4个TNBC的亚型。数据在 GSE76275
  • 发表在 Breast Cancer Res. 2015 Mar 2:Gene-expression molecular subtyping of triple-negative breast cancer tumours: importance of immune response,数据在 GSE58812, 法国研究团队的等人使用 适应性的Fuzzy-clustering 把107个TNBC 患者分成3类。
  • 中国团队发表在 Breast Cancer Res. 2016;题目是:Comprehensive transcriptome analysis identifies novel molecular subtypes and subtype-specific RNAs of triple-negative breast cancer ,使用的是[GEO:GSE76250].
  • 发表在 J Exp Clin Cancer Res. 2018 Dec;的文章:Classification of triple-negative breast cancers based on Immunogenomic profiling. 使用的是4个公共数据集,METABRIC, TCGA, GSE75688,单细胞, and GSE103091,是两个法国队列的结合, 根据ssGSEA scores) of the 29个免疫基因集,分成HIGH,M,LOW 这3组。
  • 中国团队发表于2019年3月的文章,题目是是:Multi-omics profiling reveals distinct microenvironment characterization and suggests immune escape mechanisms of triple-negative breast cancer 里面使用ssGSEA算法对CIBERSORT的免疫基因集进行分析,数据在 GSE76250 可以下载,把TNBC 患者分成3类。
  • 发表在 Breast Cancer Res. 2019 May 的文章,题目是:Identification of three subtypes of triple-negative breast cancer with potential therapeutic implications. 还是前面的法国团队在 GSE58812数据集的基础上,加上GSE83937 得到238个TNBC病人,等同于GSE103091,是两个法国队列的结合
  • 发表于 Cancers (Basel). 2019 Jul; 文章:Decoding Immune Heterogeneity of Triple Negative Breast Cancer and Its Association with Systemic Inflammation 使用的是GSE86945 数据集,使用 NMF算法,得到54 TNBC tumors were re-classified into 3 Im-Clus (ImA n = 15, ImB n = 18, ImC n = 21)

其中贝勒医学院分两次 收集了 198个TNBC病人, (discovery set: n=84; validation set: n=114) 比较稳定的把TNBC分成了4个亚型,而且还分析了7个公共数据集来验证其结论。作者整理的4个亚型以及其可能的靶点:

  • 1) LAR: androgen receptor and the cell surface mucin MUC1;
  • 2) MES: growth factor receptors (PDGF receptor A; c-Kit);
  • 3) BLIS: an immune suppressing molecule (VTCN1)
  • 4) BLIA: Stat signal transduction molecules and cytokines.

其中BLIA组的预后最差,LAR的拷贝数变异比较独特。

TNBC多组学

看到文章 DOI: 10.1158/2159-8290.CD-18-1177 Published February 2019 介绍的很详细:

0 人点赞