译者:
杨伊词(大连医科大学附属第二医院血液科,硕士研究生)
译者总结;
摘要:
嵌合RNA是包含两个独立基因的外显子杂交的转录物。传统观点认为嵌合RNA是由染色体重排引起的基因融合而来。这些典型的嵌合RNA被描述为具有癌症特异性表达模式和/或作为癌基因产物。然而,得益于深度测序技术的发展,一类新的非典型嵌合RNA被发现可以通过相邻基因之间的反式剪接或顺式剪接(cis-SAGe)机制形成,而没有基因组的异常。尽管一部分非典型嵌合RNA已被证明具有癌症特异性表达模式,在正常生理机能中也能广泛检测到。进一步的研究表明,它们中的一些可能具有独立于亲代基因控制细胞生长和细胞运动的作用。这些发现揭示了一个新的功能转录组,也提高了非典型嵌合RNA作为癌症诊断标记和治疗靶点的可能性。
在本文中,我们将概述不同类别的嵌合RNA在各种类型的癌症和正常样本中的表达。由于嵌合RNA不是癌症独有的,在正常机体中也能被测出,因此我们运用生物信息学和生物学方法来鉴定出癌症特异性嵌合RNA。此外,我们将探究嵌合RNA的下游作用方法,以探索它们的分子加工机制和潜在功能,为开发新的癌症生物标志物和治疗靶点铺平道路。
1. 背景:
众所周知,癌症的标志之一就是基因组异常,包括单核苷酸多态性(SNPs)、拷贝数异常和染色体重排 [1]。对肿瘤发生中基因组复杂性的原理探究使研究人员和临床医生能够更好地理解癌症的发展。融合基因是指两个原本独立的基因通过染色体重排融合在一起的一种融合产物。一定比例的融合基因会被转录成嵌合融合转录物,它们可以通过保留其亲本基因的阅读框架、影响亲本基因表达或作为长的非编码嵌合RNA发挥作用来形成融合蛋白[2-4]。
由于融合基因在癌症中的特异性表达,大量融合基因已被确认为肿瘤标志物[5,6]。此外,还发现这些融合基因中的一部分是具有促进肿瘤发生的癌基因,因此可以被作为治疗靶点[7,8]。这些融合基因的转录物也被认为是理想的肿瘤标志物,用于检测某些癌细胞的存在[9]。然而,随着许多新型嵌合转录物的发现,使得嵌合RNA的定义已经不再是融合转录物仅能由融合基因转录而来[10,11]。根据新定义,嵌合RNA是指任何含有来自两个独立亲本基因外显子的嵌合转录物,它们可以通过基因间剪接事件产生,而没有基因组水平的变化。
传统的嵌合RNA检测依赖于荧光原位杂交检测(FISH)或PCR分析,而嵌合RNA较低的发生率和不同的基因断点部位使得它们的鉴定出现困难。二代测序技术的出现使得大量嵌合RNA的鉴定成为可能。除了融合基因的转录产物,新型嵌合RNA还包括两类由相邻基因间的反式剪接和顺式剪接(顺式SAGe)形成的转录产物[10,12]。有研究发现,这些非典型嵌合RNA不是癌症特异性的,而是同时存在于正常组织中[13]。Singh等人对涵盖53个正常人类组织的9000多个样本的基因型-组织表达(GTEx)数据集进行了RNA-序列分析,以探索非典型嵌合RNA的研究前景[14]。结果表明在各种正常组织中发现了数千个这样的非典型嵌合RNA,证明了这些RNA在正常生理组织中也是普遍存在的。在某种程度上,它们可能作为人类的一个新的功能转录组的扩展。
就像选择性剪接RNA或长非编码RNA一样,尽管这些非规范嵌合RNA作为一种现象在正常生理学中很常见,但它们可能在癌症中翻译出错。据报道,它们中的一类在某种癌症中具有特异性,因此可能作为癌症生物标志物和/或治疗靶点[11,15]发挥作用。在本文中,我们将概述嵌合RNA在癌症和正常生理组织中的表达,并为癌症特异性嵌合RNA的研究提供一个全面生物信息学和生物学渠道。
首先,我们将总结嵌合RNA的类别和术语,以便更好的从机制的角度研究嵌合RNA 。然后,我们将仔细研究当前新型嵌合RNA作为肿瘤标志物的临床用途和潜在意义。沿着这条路线,我们通过讨论当前使用嵌合RNA作为肿瘤标志物的方法以探索新型嵌合RNA的发展潜力。然后,我们将继续从嵌合RNA的机制和功能导向上研究,旨在揭示其形成的机制及其在人类细胞中的生物学作用。最后,我们将概述嵌合RNA促进肿瘤发生的机制以及当前融合基因作为治疗靶点的用途。
2. 嵌合RNA的分类
嵌合RNA的定义是来自两个最初分离的基因的RNA序列杂交后的转录产物。因此嵌合RNA可以通过不同的机制产生,如融合基因转录或基因间剪接。在这一章节中,我们将从嵌合RNA的生物发生途径上分类描述它们。
嵌合RNA的形成机制。红色或蓝色片段代表外显子,灰色片段代表内含子或基因间区域。(A)染色体重排导致在DNA水平上形成融合基因。融合基因被转录并拼接成嵌合RNA。(B)反式剪接。从两个独立的基因转录而来的两个前体mRNA被拼接成一个嵌合RNA。(C)相邻基因之间的顺式剪接(cis-SAGe)。转录回读发生在位于同一条链上具有相同转录方向的两个相邻基因之间,前体回读转录物被拼接成一个嵌合RNA。
传统观点认为嵌合RNA是融合基因的专有产物。众所周知,融合基因是由基因组不稳定性引起的染色体重排导致的(图2A)。染色体易位是一类经典的染色体重排产生融合基因的情况,是造血和淋巴系统肿瘤形成的标志。[5]其中最著名的就是由9号染色体和22号染色体之间的易位形成的费城染色体,出现了BCR和ABL基因的融合。超过95%的慢性粒细胞白血病患者的样本中都检测到BCR-ABL融合基因,又由于其在CML中的特异性,因此被广泛用于慢性粒细胞白血病的诊断。除此之外,前列腺癌中的TMPRSS 2-ETV 1[19]和各种癌症类型中的ETV 6 NTRK 3[23–25]融合基因也是由于染色体重排形成的。另一种融合基因的形成机制是基因间的间质缺失,如神经母细胞特异性的FOXR1基因上游的间质缺失引起的MLL-FOXR1和PAFAH1B2-FOXR1融合基因[41],在神经母细胞中特异性表达。染色体倒位也是融合基因产生的机制之一,在患有急性髓细胞白血病(AML)的婴儿患者中发现了MLL-CALM融合基因(由融合到CALM基因中的MLL倒位形成)。非小细胞肺癌中也存在染色体倒位产物的形成,如著名的EML 4-ALK[26]融合基因,使用克唑替尼治疗具有这类融合基因的患者的有效率达到了60%。[8]
随着下一代RNA测序的发展,已经检测到大量从融合基因转录而来的嵌合RNA [43]。同时,一类在DNA水平上没有变化的嵌合RNA也正在被发现。这种嵌合RNA被称为“非典型嵌合RNA”它们可以通过相邻基因之间的反式剪接或顺式剪接产生(顺式SAGe)。反式剪接的生化机制是两个RNA转录物被剪接在一起 (图2B),可以进一步细分为基因间反式剪接和基因内反式剪接。基因间反式剪接形成的嵌合RNA可能来源于不同染色体上的两个基因[10],或同一染色体上相同或相反链上的两个基因[44,45]反式剪接而成;基因内反式剪接可能来源于相同亲本基因的正义和反义转录物之间[46],或者由相同定向转录物的不同拷贝反式剪接产生,然后导致外显子的改变[47]。
与从一部分肿瘤特异的融合基因转录而来的嵌合RNA不同,许多非典型反式剪接嵌合RNA并不是癌症特异表达的。最著名的例子是JAZF1JJAZ1 (SUZ12)和PAX3-FOXO1。JAZF1-JJAZ1是染色体易位产生的融合基因[27],在超过8篇文章中报道,50%的子宫内膜间质肉瘤(ESSs)中有发现这种融合基因。然而,通过JAZF1和JJAZ1的mRNA之间的反式剪接形成的JAZF1-JJAZ1没有任何染色体易位,其嵌合转录物也被发现在正常子宫内膜细胞中表达[10]。而对于染色体易位导致的PAX3-FOXO1,虽然在55%患有肺泡横纹肌肉瘤(ARMS)的儿童患者中可被检测到并已被用作全球许多病理实验室的辅助诊断手段[28,29]。然而,相同的PAX3-FOXO1转录物被发现在正常肌细胞分化过程中也会短暂表达[30]。
非典型嵌合RNA形成的另一种机制是顺式作用(cis-SAGe)(图2C)。这些嵌合RNA被称为转录诱导基因融合体[48,49],串联RNA嵌合体[50],连接基因[51]和回读融合体[52]。通常用术语“cis-SAGe”将这些嵌合RNA与相邻基因间顺势作用产生的嵌合RNA区分开来。当RNA聚合酶II在转录过程中忽略停止信号,在两个相邻基因间产生了一个转录前回读,然后剪接出了一个成熟的嵌合RNA。EST数据库、RNA序列文库和电子分析已经成功地鉴定了许多由两个独立的相邻基因组成的嵌合RNA[48,53]。据估计,人类基因组中4-5%的串联基因对可以转录成一个单一前体mRNA,并最终拼接成一个嵌合RNA[50]。最近一项在GTEx数据库中对正常组织中反复发生的嵌合RNA进行的研究中,发现cis-SAGe嵌合RNA占了这些RNA的很大一部分[14]。
cis-SAGe嵌合RNAs有一些共同的特征:(1)亲本基因是位于同一条染色体上的同链相邻基因(2)5’端的亲本基因被主动转录(3)亲本基因之间的基因间距离在30 kb以内(4)嵌合体的连接位点倾向于在亲本基因5’端的第二至最后一个外显子与亲本基因3’端的第二个外显子融合,这也称为2-2规则(5)嵌合体倾向于由外显子边缘的规范剪接位点连接而成。Cis-SAGe嵌合RNAs在癌症和正常生理中都存在,但它们在癌症中可能被错误修饰和不适当表达。例如,在前列腺癌和正常前列腺样本中都可能表达SLC45A3-ELK4,而前者的表达率明显高于后者[11]。CHFR-GOLGA3在膀胱癌中的检出率高于正常膀胱组织[31]。
(未完待续)