鼻咽癌主要是在中国南方以及东南亚地区,所以香港大学团队做这方面科研探索是情理之中。本次分享的肿瘤外显子研究非常早期了,是2016年发表在 PNAS 杂志的:《 Whole-exome sequencing identifies multiple loss-of-function mutations of NF-κB pathway regulators in nasopharyngeal carcinoma 》。
本次研究纳入了NPC患者的原位肿瘤和转移瘤样品:
- 51 primary tumors (肿瘤外显子)
- 8 recurrent tumors, 3 of which had matching lymph node metastatic tumors(肿瘤外显子)
- additional 73 primary tumors (捕获测序技术)
- RNA sequencing (RNASeq) was performed in 10 tumor pairs with adequate quality and quantity of RNA.
病人队列和实验设计有很清晰的流程图:
病人队列和实验设计
肿瘤外显子和捕获测序,就是普通的fastq数据文件的找变异啦,如果你也有类似的肿瘤外显子测序数据,可以看《肿瘤外显子》专栏的目录(节选)如下:
- (一)读文献并且下载测序数据
- (二)质控与去接头
- (三)比对
- (四)比对结果的质控
- (番外篇)bam文件载入igv可视化
- (五)GATK的最佳实践
- (六)vcf文件的注释及ANNOVAR的使用
- (七)maftools可视化
- (八)不同注释软件的比较(上):安装及使用
- (八)不同注释软件的比较(中):注释后转成maf文件
- (八)不同注释软件的比较(下):可视化比较maf文件
文章的《肿瘤外显子》数据分析策略其实比较旧了,毕竟是2016年发表的,如下所示:
数据分析策略
肿瘤somatic突变全景图
文章最重要的图就是显示鼻咽癌在4个通路容易发生突变,包括点突变和拷贝数变异,所以一个全景图就足以展示了:
肿瘤somatic突变全景图
成百上千个基因在五十多个病人里面有突变,就需要判断哪些突变是重要的,这里作者使用了MutSigCV这个经典的软件来对基因突变进行重要性排序。top 100的基因主要是富集到了上图的通路:
- cell cycle-phase transition,
- cell death,
- EBV infection,
- viral carcinogenesis,
- the canonical NF-κB pathway
其中 NF-κB pathway-negative regulators, 是最显著的,包括3个基因:
- NFKBIA,
- CYLD lysine 63 deubiquitinase (CYLD),
- TNF alpha-induced protein 3 (TNFAIP3).
它们有大量的 loss-of-function [LOF; including stopgain, frameshift insertions and deletions (INDELs), and splicing] mutations
NF-κB pathway-negative regulators
文章也在附件对其它通路进行丰富的展示,尤其是表观调控的,包括:
- chromatin remodelling,
- histone chaperone complex,
- histone and DNA methylation (Me),
- histone acetylation (Ac) and ubiquitylation (Ub).
当然了,也有其它重要的突变,比如TP53 is the most frequently mutated gene in our cohort, with 9 of 124 primary tumors (7.3%) harboring missense mutations.