我在我在04-转录组笔记推文任务列表(半年期)里面安排了6个经典综述和10篇转录组应用文献给大家,可惜愿意沉下心了认真苦学的并不多。(https://share.mubu.com/doc/14uneHKvPg)
所以安排转录组讲师给大家做一下领读:
下面是转录组讲师的投稿
文章信息
标题:Genomic and Transcriptomic Characterization of Sporadic Medullary Thyroid Carcinoma
标题:散发性甲状腺髓样癌的基因组和转录特征
杂志:Thyroid(IF 5.227). 2020 Jul
作者:Qing-Hai Ji1,2(通讯)1 复旦大学上海肿瘤中心头颈外科;2 复旦大学上海医学院肿瘤学系;3 复旦大学上海肿瘤中心,复旦大学生物医学研究所医学表观遗传学与代谢重点实验室
背景知识
散发的甲状腺髓样癌,英文为:Sporadic medullary thyroid carcinoma,缩写MTC,是一种相对罕见的神经内分泌恶性肿瘤,由产生降钙素的旁淋巴细胞(c细胞)引起。MTC在所有甲状腺恶性肿瘤中占3-5%,但在甲状腺癌相关死亡中占近13%。**与分化良好的甲状腺癌比较,MTC在生物学上具有更强的侵袭性,可以增加广泛淋巴结转移和局部晚期侵袭的可能性。**此外,MTC对放射性碘或促甲状腺激素抑制没有反应,对放射治疗和常规细胞毒性化疗也不敏感,导致在晚期疾病的治疗有限。
摘要
背景:散发性甲状腺髓样癌(MTC)是一种相对少见的神经内分泌恶性肿瘤,其散发性甲状腺髓样癌(sMTC)的分子肿瘤发生机制尚不完全清楚。在这项研究中,我们进行了一项聚焦于sMTC基因组和转录组特征的研究。
方法:纳入29例sMTC患者。对18名患者进行了全外显子组测序(WES),包括肿瘤样本和匹配的非癌组织。29例肿瘤均进行了全转录组测序(RNA-Seq)。分析WES、RNA-Seq和拷贝数改变(CNA)数据。采用细胞计数Kit-8 (CCK-8)检测细胞增殖。
结果:
- 在体细胞突变中,RET是唯一复发的癌症相关突变基因(5/18,27.8%)。
- 在生殖细胞突变中,脂肪基因家族的两个成员FAT1和FAT4被确定为两个最常见的突变基因。
- CNA分析发现,位于染色体4q上的FAT1和FAT4也是最常受体细胞染色体缺失影响的两个基因(4/18,22.2%)。
- 使用TT和MZ-CRC-1细胞系,CCK-8检测结果显示,敲除FAT1和FAT4可促进MTC细胞增殖。
- 基于基因表达谱,患者被聚集成两种分子亚型:间充质样亚型以上皮-间充质转化为特征,而增殖样亚型与细 周期通路的富集有关。
- 大多数结构性复发(80%)发生在增殖样亚型中。
结论:
- 除了RET外,这些发现表明,在sMTC中,FAT1/FAT4基因组的改变也很常见。
- 两种具有不同生物学行为的sMTC分子亚型被鉴定出来。但是,这些结果需要在未来更大的样本和更全面的实验来验证,特别是对于FAT1/FAT4种系变异的频率和功能。
数据和方法
1 病人样本和临床病理资料
29个病人,其中有18个病人有配对正常组织。是新鲜冷冻组织。见补充材料Table S1
2 Whole-exome sequencing
对18个病人的配对组织36例样本进行全外显子测序;150-bp paired-end reads;Illumina测序平台。
3 Alignment and variant calling
- 数据过滤:FastQC
- 参考基因组:GRCh37
- 比对:BWA
- GATK :SNV 和Indel
- 注释:ANNOVAR
- identify SNVs and Indels 过滤条件:
- (1) variants with a quality <30, a depth of coverage <20 in tumor or plasma samples, or <2 reads supporting the variant were filtered out;
- (2) only variants within the exonic or splicing site were retained;
- (3) variants reported in more than 1% of the population in the 1000 Genomes Project (1000gAUG_2015ALL) or the Exome Aggregation Consortium (ExAC_ALL) or the Genome Aggregation Database (gnomAD_ALL) in the East Asian population were discarded as they were regarded as singlenucleotide polymorphisms
- (4) synonymous variants were excluded.
4 体细胞和生殖细胞突变识别
体细胞突变:评估每个变异的效应:SIFT ,Polyphen2 ,MutationTaster ,参数设置为软件默认
生殖细胞突变:InterVar database
5 CNV识别
6 通路相关的癌症基因突变
7 细胞培养和试剂
8 小干扰RNA转染和细胞计数Kit-8实验
9 RNA-Seq
- The RNA quality :2100 bioanalyzer
- Illumina sequencing platform;150-bp paired-end
- 参考基因组:GRCh38;注释文件:GENCODE v29 annotation
- 比对:STAR;定量:featureCounts
10 聚类
- 数据:the top 1000 most variable genes ,ConsensusClusterPlus
结果
1 由WES识别的突变
- 数据:18对配对样本,肿瘤样本平均测序深度120X,癌旁样本150X。
- 识别了癌症相关的48个体细胞突变:45个错义替换,1个无义突变,2个nonframeshift deletions
每个病人平均只有2.7个突变,比较低。
RET基因是唯一一个在两个以上的样本中出现突变的基因,突变情况如下图:p.C634R (n = 2), p.M918T (n = 1), p.A883F (n = 1), and p.C630G (n = 1)
- 识别了203个生殖细胞突变,FAT1 (n = 4) 和FAT4 (n = 3) 两个肿瘤抑制基因,属于同一非典型钙粘蛋白超家族,是突变频率最高的基因。
突变详细情况:
此外,这三个基因的突变都由桑格测序得到了验证。
2 CNA 分析
- 数据:上述18个病人的配对样本
- 没有识别到生殖细胞突变
- 在9例(50.0%)肿瘤样本中检测到31例体细胞群体基因拷贝数变异,涉及754个癌基因和抑癌基因
- 最常见的体细胞变化包括4q染色体拷贝数损失(n = 4,22.2%)和1p染色体拷贝数损失(n = 4,22.2%)
结合WES和CNA结果,我们发现体细胞突变时间高度集中在the RTK/RAS pathway通路(包括RET, ERBB3, and the RasGAP gene family)和the Hippo pathway(包括including FAT1, FAT4, LATS2, and others)。
总体而言,50.0% (n = 9)的MTC样本在RTK/RAS信号轴上显示了体细胞SNVs或CNVs,而44.4% (n = 8)的样本显示Hippo通路基因的改变。
3 CCK-8 assay
采用TT细胞系和MZ-CRC-1细胞系,采用CCK-8法研究敲除FAT1和FAT4对MTC细胞增殖的影响。如上所述,与之前的研究(32)相似,虽然细胞被短暂转染,但由于两种细胞系的倍增时间延长,OD450值连续测量了5天。CCK-8结果显示,在TT和ms - crc -1细胞中,敲除FAT1和FAT4均能显著促进细胞增殖。
4 使用RNA-Seq数据进行分子分型
- 数据29个肿瘤样本
转录组的标准分析,比较容易复现,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;
- 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版 R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
非监督聚类将29个样本分成亚类,最佳聚类数为2。下图为热图展示的分成两类的结果。
然后,对这两个cluster做GSEA的cancer hallmark signatures基因集合分析。我们发现,上皮-间充质转化(EMT)基因集在Cluster 1中富集,而MYC靶标V1在Cluster 2中富集程度较高。cluster1和Cluster 2分别被称为间充质样亚型和增殖样亚型,分别以EMT和增殖活性增强为特征。
我们进一步评估了这两种分子亚型的临床相关性。
此外,我们还发现:cluster1的15个病人中,只有一个病人在随访期间出现了structural recurrence,大多数 structural recurrence events (4/5, 80%) 出现在14 cluster2病人组中。
总结
问题1:转录组(GRCh38)和基因组(GRCh37)的数据分析没有使用同一个参考基因组没有问题么?后面通过gene symbol将两个层面的数据联系起来?我没有比较过两个版本的基因组数据的差别,欢迎讨论。
文章的创新点:散发的甲状腺髓样癌算是一个稀有癌种,基础研究相对少。整个文章思路还是很清楚的,就是两个测序,做了一些基本的分子层面的特征刻画。但是文章的样本数相对来说有点少了,看突变频率有点失真。