今天和大家分享的是2020年6月发表在Molecular Cancer(IF:15.302)上的一篇文章,“The genetic and pharmacogenomic landscape of snoRNAs in human cancer”,本篇文章中,作者研究了遗传变异对snoRNA表达的影响,以及snoRNA表达对药物反应的影响。为了使其他研究人员可以获得这些数据,作者还建立了一个用户界面友好的数据库——GPSno,希望能为未来基于snoRNA的靶向治疗的发展提供帮助。
The genetic and pharmacogenomic landscape of snoRNAs in human cancer人类癌症snoRNAs的遗传和药物基因组学全景
一、研究背景
核仁小RNA(snoRNAs)是一类广泛存在于真核生物细胞核仁的小分子非编码RNA。越来越多证据表明snoRNA在癌症中起重要作用,如删除SNORD50A/B可能与致癌的KRAS突变协同作用,导致Ras-MAPK过度活化;SNORD46可以促进癌细胞生长,迁移和侵袭。近来有研究发现,大量癌症患者中出现snoRNA的表达谱和拷贝数变异。但遗传变异是否影响snoRNAs的表达水平,snoRNAs的改变是否与患者的药物反应有关等仍未阐明。
二、分析流程
三、结果解读
1.遗传变异对snoRNA表达的影响
为了全面描述不同肿瘤类型中,遗传变异对snoRNA表达的影响,作者首先对TCGA数据库中,29个肿瘤类型、9449个肿瘤样本的基因型数据和snoRNA表达数据进行snoRNA表达数量性状位点(QTL)分析。(图1A)基因型数据经过填充后,筛选SNP。用Matrix eQTL包线性回归分析遗传变异对snoRNA表达的影响。FDR<0.05的SNP定义为snoQTLs,相关snoRNA 1 Mb内的snoQTL定义为cis-snoQTL,反之为trans-snoQTL。
对snoRNAs近端基因调控(snoRNA 1 Mb以内的SNP)的分析,29个肿瘤类型中共识别了69557对显著的SNP-snoRNA。如胰腺癌(PAAD)中,cis-snoQTL rs6483262等位基因对SNORA25表达的调节作用显著(图1B)(值得注意的是,SNORA25曾被报道有望成为早期胰腺癌筛查的分子标志)。作者还检测了cis-snoQTLs和对应snoRNAs的相对位置分布,发现cis-snoQTLs优先定位于临近snoRNAs的地方(图1C)。
对snoRNAs远端基因调控(snoRNA位点1 Mb外的SNP)的分析,29个肿瘤类型中共识别了34151对显著的SNP-snoRNA。如肺腺癌(LUAD)中,rs8069739等位基因远端调节U8的表达(Fig.1D)。而据报道,敲除肺腺癌中的U8会显著诱发依赖p53的抗肿瘤应激应答。
作者进一步绘制患者OS和不同基因型的KM曲线,研究遗传变异与snoRNA表达的临床关联。在不同癌症类型中,作者鉴别出了475个与患者OS相关的SNP等位基因(FDR<0.05),即生存相关snoQTL。如肾透明细胞癌(KIRC)中,携带纯合rs1694419 AA的患者OS比携带杂合Aa和纯合子aa的患者OS差 (图1E)。且89.7%的癌症类型中(包括KIRC),携带纯合rs1694419 AA的患者SNORD45B的表达量要显著高于携带杂合Aa和纯合aa的患者。与瘤旁正常组织相比,KIRC肿瘤组织中SNORD45B显著上调,而高表达患者OS比低表达患者差。上述结果说明,snoQTLs对患者生存的影响是通过调节snoRNAs表达实现的。
为了识别全基因组关联分析(GWAS)相关的snoQTLs,作者从GWAS目录摘取了28345个性状/疾病相关SNP,获得1167961个位于GWAS 连锁不平衡(LD)区域的SNP。作者识别了29795对snoQTL-snoRNA,这些snoQTLs均与不同癌症类型中已知的疾病/性状相关位点重叠。如睾丸癌中,rs60180747与睾丸生殖细胞肿瘤(TGCT)显著相关。分析发现,rs60180747在15q22.31上标记了一个261kb的单倍域,包含多个基因如TIPIN,MAP2K1,DIS3L,SNAPC5,RPL4和ZWILCH(图1F),而rs6018047位于TIPIN基因的内含子区域。然而,风险等位基因不与TGCT患者15q22.31的任何蛋白编码基因相关。进一步检测临近的SNP,作者发现在LD区域与rs60180747连锁的rs12905354与SNORD18A表达显著相关。这些研究表明,SNORD18A可能是TGCT GWAS位点的一个靶点。
图1.泛癌snoQTL分析
2.不同肿瘤类型中snoRNAs的药物基因组学全景
为了阐明snoRNA表达对药物反应的影响,作者综合分析TCGA患者中snoRNA表达差异与抗癌药物反应的关联。Pearson相关分析包含了18种TCGA癌症类型中至少50名患者的药物反应数据和snoRNA表达数据,FDR<0.05的snoRNA定义为药物反应相关snoRNA。从食管癌(ESCA)到TGCT,药物反应相关snoRNA从0到7226不等,中位数为113(图2A)。且药物反应相关snoRNA数量与样本数不相关。
作者分析了不同癌症类型中药物反应的各种靶点通路,发现snoRNA (390 box C/D snoRNAs,184 box H/ACA snoRNAs,和27 scaRNAs)对患者的药物反应均有广泛影响。而在这些药物靶点通路中,细胞骨架通路的药物反应相关snoRNA数量最多(图2B)。于是作者进一步在至少包含100个药物反应显著相关snoRNA的10个癌症类型中,用费舍尔精确检验评估了药物靶点通路的富集情况,发现细胞骨架通路在5个癌症类型中显著富集(p值<0.05)(图2C)。
接下来作者开始研究snoRNA对抗癌药物的影响。以前列腺癌(PRAD)为例,29个抗癌药物均与至少5个snoRNAs显著相关(图2D)。且不同的snoRNAs对特定药物的反应表现出正/负相关的一致性,可能是因为这些snoRNAs在特定癌症类型中的表达高度相关。而在PAAD患者中,SNORA23的表达水平与axitinib的药物反应高度关联(P值= 0.93 × 10− 3,图2E)(已知SNORA23可以促进胰腺癌的肿瘤生长和转移)。因此,在未来的axitinib临床试验中,可能需要考虑SNORA23的表达水平。这些结果表明,适当水平的snoRNAs可能对药物治疗的反应有益。
图2.snoRNA的药物基因组学全景
3.一个探索癌症snoRNAs遗传影响和药物基因组学全景的综合数据资源
作者开发了一个用户界面友好的数据库GPSno,使数据的可视化,搜索和浏览更加便利(图3)。GPSno包含5个主要模块:cis-snoQTLs,trans-snoQTLs,survival-snoQTLs,GWAS-snoQTLs和药物反应。提供多种搜索的入口,支持用户自定义过滤,如癌症类型,SNP ID和snoRNA ID。也可以根据癌症类型、SNP ID或snoRNA查询数据。
搜索示例:在cis/trans-snoQTL页面搜索,会得到一个包含SNP ID,SNP基因组位置,SNP等位基因,snoRNA ID,snoRNA位置,beta 值(SNP对基因表达的效应量)和snoQTL P值的表格(图3C)。搜索结果的表格、图表可以以XLSX、PDF形式下载。文档页面包括数据库的介绍、构建管道和解释指南。这个数据库可以为未来的实验选择候选snoRNAs提供一个独特的资源。
图3.GPSno网页设计和搜索设计
小结
为了阐明snoRNAs在肿瘤形成中的作用,作者在TCGA多种肿瘤类型中系统研究了snoRNAs对遗传变异和药物基因组谱的影响。作者分别分析了snoRNA近端和远端的SNP,并从病人生存,GWAS和药物反应三个方面研究了遗传变异的影响。绘制不同基因型与患者OS的生存曲线,发现遗传变异可能通过调节snoRNA表达而影响患者生存。分析GWAS相关snoQTL,发现snoRNA可能成为GWAS的靶点。作者还结合了患者的snoRNA表达和药物反应数据,分析了这些遗传变异与药物反应的关联,为未来的药物临床试验提供了参考,如SNORA23与axitinib药物反应高度关联,因此未来的axitinib临床试验中,就可能需要考虑SNORA23的表达水平。最后,作者介绍了一个snoRNAs遗传和药物基因组学全景的综合数据资源GPSno。总的来说,这项研究将为未来基于snoRNA的靶向治疗的发展提供帮助。
编辑:薏米仁
校审:糯米饭