杨伊词(大连医科大学附属第二医院血液科,硕士研究生)
译者总结:
3.3 候选嵌合RNA的验证
对嵌合 RNA进行实验验证是十分重要的。第一个原因是我们需要确认嵌合RNA的存在并消除嵌合RNA验证中出现的假阳性,这些假阳性可能是在软件预测时受到了其他外界因素的影响导致。为了验证候选嵌合RNA的存在,将与RNA序列分析相同来源的理想的RNA样本进行RT-PCR和其他RNA检测,对PCR产物再进一步行Sanger测序以验证连接处序列。
此外,出现的假阳性嵌合RNA 可能会使嵌合RNA的验证复杂化。例如,从进化的角度来看,嵌合RNA可能是基因的功能前体。换句话说,在低等物种中发现的嵌合RNA可以在高等物种中进化成基因。是在狨猴中鉴定出的一种嵌合RNA HNRNPA1L2-SUGT1其实与人类的一种假基因MRPS31P5具有高度的序列相似性。Wu等人证明HNRNPA1L2-SUGT1是MRPS31P5在进化过程中的功能前体[74]。考虑到序列同源性和基因传递中允许错配误差的原则,通过生物信息学方法鉴定出的候选“嵌合RNA”实际上可能是人类基因组中的完整基因。因此,在人类样本中排除这些潜在的生物信息学假象对验证候选嵌合RNA是必要的。
验证嵌合RNA的第二个原因是为了避免在正常细胞和组织误测出候选嵌合RNA。尽管前期已经通过生物信息学方法获得了特定嵌合RNA在正常组织中的表达,但是由于RNA测序的深度不同,嵌合RNA的检出率可能也有不同。因此,我们强烈建议即使针对被预测为癌症特异的嵌合 RNA,也需在一个完整的正常组织/细胞组中进行验证。嵌合RNA在细胞分化或组织发育过程中的瞬时表达也可能导致其在正常组织中被检测到。例如,在超过55%的横纹肌肉瘤(RMS)患儿中都检测出了由染色体易位形成的融合基因PAX3-FOXO1 [28]。因此临床上将PAX3-FOXO1融合基因的表达信号作为重要的诊断标记和监测疾病残留的标志。然而,在正常胎儿肌肉样品中也检测到了相同的PAX3-FOXO1嵌合转录物,而这一嵌合RNA是由反式剪接形成[30]。在成熟的正常肌肉细胞中检测不到这一嵌合转录物的原因是它仅仅在肌肉分化过程中短暂表达。这一发现警告我们使用嵌合转录物作为诊断标记是需要一定条件的。
最后一个原因是需要量化嵌合RNA在多种癌症类型和正常组织中的表达。由于可用的数据库是有限的,而不同癌症类型的RNA序列数据库的测序深度也是不同的,一些筛选出的癌症特异的候选嵌合RNA实际上可以在其他癌症类型或正常组织中表达,或者可以在不同水平上表达。因此在判断嵌合RNA的诊断潜力之前,应仔细评估其在多种癌症类型或亚群以及正常组织中的定量表达谱。
3.3.1 验证癌症中的候选嵌合RNA
需要在预测的癌细胞和组织中验证候选嵌合RNA以证明其癌症特异性。首先,我们需要通过验证连接位点的序列来研究候选嵌合RNA是否是真正的杂交转录物,该连接序列应该包含两个最初分离的转录物的序列。正如我们在3.2节中说的那样,通常是通过将RNA的预测序列与2个独立的野生型转录序列对比来预测嵌合RNA的连接位点。因此,可以通过设计含有预测的连接位点的引物,通过PCR反应来扩增出成熟的嵌合RNA。然后在凝胶纯化和桑格测序后,PCR得到的序列就通过BLAST/BLAT与人类的基因组序列进行对照验证。如果融合发生在两个不同亲本转录物之间,则可以用两个独立基因的转录序列来验证,也可以得到精确的连接位点。在这里需要注意的是,即使是来自两个相同亲本基因转录出的嵌合RNA也可能具有不同的连接位点,形成不同亚型,因而来自相同亲本的嵌合RNA可能在不同的癌症中表达。 [11,75]。所以只有获得连接位点的序列和全长序列,才能确保筛选出在相应的癌细胞和组织中特异表达的亚型嵌合RNA。
其次,要运用定量分析来检测嵌合RNA在相应的癌症样品中的表达量,这里的癌样品包括癌细胞系以及临床和表型上的典型的癌组织样品。从样品中提取的RNA通过RT-PCR分析可以得到嵌合RNA的连接位点。例如,Zhu等人对膀胱癌中嵌合RNA进行了研究,通过对膀胱尿路上皮癌RNA-seq数据库的生物信息学分析,鉴定了在膀胱癌中特异性表达的13种嵌合RNA候选物[31]。为了验证这些嵌合核糖核酸在膀胱癌中的表达,他们对T24、EJ和SC-HUC1细胞系,以及14对膀胱癌的临床样本和与之相匹配的正常样品进行了RT-PCR反应。实验发现13个筛选出的嵌合RNA中,9个可以设计出含有连接位点的PCR引物,它们中的6个可以用RT-PCR扩增出来,然后通过实时定量的PCR反应比较在肿瘤样品和正常样品之间这些嵌合RNA的表达。在已验证的嵌合体中,发现CHFR-GOLGA3优先在膀胱癌样品中表达,这种嵌合RNA之后还被进一步用于研究其机制和功能。
然而,对于嵌合RNA的验证尚有一些问题未能解决。Northern印迹是传统验证嵌合RNA的方法之一,但灵敏度较低。RNA酶保护实验因为具有更高的灵敏度而被用来验证嵌合RNA。Northern印迹和RNA酶保护实验都比较且繁琐,技术上具有一定的挑战性。RT-PCR相对来说是更加快速、简便、灵敏的技术。但是,反转录可能会形成伪像(前文提到的假阳性)。第三代测序中的直接RNA测序,通过一种高通量的方法对嵌合RNA序列和RNA全场序列的进行鉴定可望克服这些障碍。
3.3.2 评估正常生理中嵌合RNA的表达
因为嵌合RNA在正常生理中也是可能存在的[75],因此有必要在正常人类组织和非癌细胞系中验证候选的嵌合RNA。仅仅使用正常组织中的RNA序列数据库中的数据作为对照进行生物信息学过滤是有局限性的,并且可能不能全部过滤出正常生理中存在的嵌合RNA。
原则上,为了探索癌症特异性嵌合RNA,应该对预测的癌症样本嵌合RNA的表达进行评估,包括与来自人类不同种类的恶性和非恶性癌症样本、正常组织和细胞系的成对良性样本样本进行对照。Velusamya等人从慢性淋巴细胞白血病(CLL)的9个候选嵌合RNA中验证出了一个嵌合转录物YPEL 5-PPP1CB [35]。为了研究YPEL 5-PPP1CB在癌症和正常组织样品中的表达,他们对103例CLL样本、5例良性淋巴结增生和纯化的淋巴细胞亚群样本中对嵌合RNA的表达进行了对比。在进一步研究YPEL5-PPP1CB对CLL发展的特异性影响时,他们在其他癌症的135个原始样本对这种嵌合RNA的表达进行了检测。
通过转录组测序分析在前列腺癌样本中发现了嵌合转录物SLC45A3-ELK4,并且发现它的形成与染色体重排是无关的[11]。这种嵌合体的一种亚型SLC45A3外显子4与ELK4外显子2融合形成的e4e2形式,最初是在前列腺癌转录组测序中发现的[75]。研究显示e4e2 SLC45A3ELK4嵌合转录物在一些前列腺癌细胞系(包括转移性前列腺癌细胞系和LNCaP)中高表达,但在其他前列腺癌细胞系(22Rv1、VCaP和MDA-PCA-2B)中低表达,而在良性前列腺上皮细胞(PREC和RWPE)和非前列腺细胞系(包括乳腺、黑色素瘤、肺、慢性髓性白血病(CML)和胰腺癌细胞系)中不存在[75]。然而,在前列腺癌组织边缘的良性细胞中也检测到了这种嵌合RNA的表达。[76,77]。另一种YPEL 5-PPP1CB的亚型, SLC45A3-ELK4 e1e2被发现与前列腺癌的进展有更大的相关性。它是第一个确认的癌症特异性非典型嵌合RNA,通过cis-SAGe形式形成而非染色体重排[12]。
这个由于转录回读形成的嵌合RNA在31个前列腺癌样本和6个良性前列腺组织样本中得到了验证 [11]。同时,也在其他类型的癌组织、各种前列腺细胞系(LNCaP、PC3和RWPE-1)和正常组织的细胞系(HCT116、293T、HeLa、H520和A549)中都进行了测试[12]。发现SLC45A3-ELK4 e1e2在良性前列腺组织和前列腺癌中都有表达,但仅在前列腺癌细胞系LNCaP和一部分恶性前列腺癌样本中高表达;在对14名有患前列腺癌风险的男性术前、术后尿液标本进行样品采集及嵌合RNA表达筛查中,也检测到了这种嵌合RNA的高水平表达[11]。所有的结果都表明SLC45A3-ELK4 e1e2有可能作为恶性前列腺癌的诊断生物标志物。然而,除了以上所做的实验,还应该对正常组织中SLC45A3-ELK4嵌合RNA的表达进行更多的研究,以确认这种嵌合RNA作为前列腺癌诊断/预后的特异标志物的定量标准。同时临床上也需要一种针对其的精确的检测方法。
3.3.3 嵌合RNA表达与癌症的相关性
通过结果预测癌症是癌症管理中最具挑战的问题之一。癌症特异性嵌合RNA的发现使它们有可能成为癌症转录组诊断的重要成员之一。嵌合RNA在癌症发展不同阶段的差异表达也是嵌合RNA可能作为癌症预后预测工具的临床应用的原因。Guerra等人在人类卵巢癌和乳腺癌细胞以及其他癌症类型中发现了嵌合的CYCLIN D1-TROPE 2 mRNA[15]。针对CYCLIN D1-TROPE 2的功能研究表明,它具有较强的癌症相关性。为了检测其在临床中的相关性,他们在肿瘤细胞不同阶段、级别、增殖细胞(KI-67)、倍性、新生血管形成(CD34)均检测了CYCLIN D1-TROPE 2的表达,同时也检测了这些细胞中p53、Her-2和Bcl-2的表达。然后根据肿瘤直径、淋巴结侵犯和远处转移对肿瘤分期,最后对结果进行分类。[15]。
TMPRSS2-ERG嵌合RNA与前列腺癌死亡风险的增加有关。为了研究其在前列腺癌组织中的表达,对252名早期前列腺癌男性的样本进行qPCR分析 [21]。同时针对它的功能和机制研究一致表明,TMPRSS2-ERG的形成可导致ERG的过度表达,从而导致前列腺癌发生的风险增加[19]。
Zhu等人[31]通过分析膀胱尿路上皮癌的RNA序列数据库,鉴定出了13个膀胱癌特异性嵌合RNA。在膀胱癌样品和相对应的正常样品中进一步验证,发现CHFR-GOLGA3在膀胱癌中的表达明显更高,而它的亲本RNAs CHFR和GOLGA3的表达则没有膀胱癌相关性,表明其具有作为膀胱癌诊断标志物的潜力。为了进一步研究CHFR-GOLGA3的表达与临床参数之间的相关性,提取膀胱癌患者样本,按照性别、不同癌症阶段、病理类型和淋巴转移进行了分组研究。
作为转录组中的一个新发现,这些非典型嵌合RNA代表了癌症生物标志物和/或药物靶点的一个新的发展方向。因此,彻底探索这些嵌合RNA在癌症发展过程中的表达非常重要。研究中应该包括具有不同临床病理参数的原发性人类癌症样品和不同阶段的永生化癌细胞系;同时还应该考虑这些非典型嵌合RNA与其他已知的癌症分子标记物或致癌途径中的重要分子是否具有潜在联系。
(未完待续)