100篇泛癌研究文献解读之使用EXPANDS和PyClone量化肿瘤内部异质性

2019-06-15 15:27:17 浏览数 (1)

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)

发表在 Nat Med. 2016 Jan的pan-cancer研究,文章是:Pan-cancer analysis of the extent and consequences of intratumor heterogeneity. 关于肿瘤内部异质性的探索,而且分析了这个异质性对其它基于TCGA数据库的数据挖掘结论的影响。可以跟前面关于肿瘤纯度的pan-cancer研究对比学习。

数据来源

是12个癌症肿瘤的1165个病人的WES数据,使用 MuTect and ExomeCNV 两个软件分别得到 Somatic single nucleotide variants (SNVs) and copy number variants (CNVs),然后使用 EXPANDS and PyClone 来量化 Intra-tumor heterogeneity (ITH) ,其实我个人觉得肿瘤的MAF文件的MATH值更能代表肿瘤内部异质性。

克隆结果

走 EXPANDS 和 PyClone 软件可以得到每个WES数据的推断克隆数量:

分开癌症进行可视化:

分组

这里根据CNV情况和克隆数量情况对肿瘤样本进行分组,分成4组:

  • (i) CNV abundance 75% and a maximum of two clones;
  • (ii) CNV abundance ?75% and a minimum of three clones;
  • (iii) CNV abundance >75% and a maximum of two clones;
  • (iv) CNV abundance >75% and a minimum of three clones.

生存分析具有统计学显著性:

后记

从流程图来看,本研究并不复杂,就是使用 EXPANDS and PyClone 来量化 Intra-tumor heterogeneity (ITH),主要是讨论部分写的真多。

当然了,如果你想超脱于他们的泛癌计划已经发表的研究,那么就非常有必要跟着我读完这100篇泛癌文献!

详见我的100篇泛癌研究文献解读目录:http://www.bio-info-trainee.com/4132.html

TCGA教程长期更新列表

  • TCGA的28篇教程-使用R语言的cgdsr包获取TCGA数据(cBioPortal)
  • TCGA的28篇教程-使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
  • TCGA的28篇教程-使用R语言的RTCGAToolbox包获取TCGA数据 (FireBrowse portal)
  • TCGA的28篇教程-批量下载TCGA所有数据 ( UCSC的 XENA)
  • TCGA的28篇教程-数据下载就到此为止吧
  • TCGA的28篇教程-指定癌症查看感兴趣基因的表达量
  • TCGA的28篇教程-对TCGA数据库的任意癌症中任意基因做生存分析
  • TCGA的28篇教程-整理GDC下载的xml格式的临床资料
  • TCGA的28篇教程-风险因子关联图-一个价值1000但是迟到的答案
  • TCGA的28篇教程-数据挖掘三板斧之ceRNA
  • TCGA的28篇教程-所有癌症的突变全景图
  • TCGA的28篇教程-早期泛癌研究
  • TCGA的28篇教程-CNV全攻略
  • TCGA的28篇教程-GTEx数据库-TCGA数据挖掘的好帮手
  • TCGA的28篇教程-所有癌症的突变全景图

0 人点赞