一篇多芯片生信分析(meta)

2019-05-08 09:57:18 浏览数 (1)

摘要

背景:

以往的研究表明,miR-144-3p可能是非小细胞肺癌(NSCLC)的潜在生物标志物。然而,miR-144-3p对NSCLC起源,分化和凋亡的影响以及miR-144-3p与临床参数之间关系的综合机制很少有报道。

方法:

我们通过Gene Expression Omnibus(GEO),相关文献,癌症基因组图谱(TCGA)和RT-qPCR收集的数据,研究了miR-144-3p表达与临床特征之间的相关性。 RT-qPCR分析以确定miR-144-3p在NSCLC中的临床作用。此外,我们通过Gene Ontology(GO),Kyoto Encyclopedia of Genes and Genomes(KEGG)分析研究了miR-144-3p的生物学功能。建立蛋白质 - 蛋白质相互作用(PPI)网络以识别核心基因。

结果:

meta分析显示,miR-144-3p联合SMD为-0.95,95%CI为(-1.37,-0.52),表明miR-144-3p在NSCLC组织中表达较少(相比正常组织)。 MiR-144-3p表达与分期,淋巴结转移和血管侵犯显着相关(P <0.05)。通过生物信息学分析,识别37个基因作为NSCLC中miR-144-3p的靶基因。这些靶基因在各种关键途径中高度富集,例如蛋白质消化和吸收以及甲状腺激素信号传导途径。此外,PPI揭示了五个基因-C12orf5,CEP55,E2F8,STIL和TOP2A-作为中枢基因,阈值为6.

结论:

目前的研究证实miR-144-3p在NSCLC中低表达。更重要的是,miR-144-3p可能作为NSCLC预后预测中的潜在肿瘤生物标志物。生物信息学分析的结果可能为研究NSCLC的发病机制提供一种新方法。

介绍

肺癌(LC)被认为是危及生命的疾病,因为发病率和死亡率在全球所有肿瘤中排名第二。占所有诊断LC病例的85%,非小细胞肺癌(NSCLC)主要分为肺鳞状细胞癌(LUSC),肺腺癌(LUAD)和大细胞癌(LCC)。目前,NSCLC的主要疗法是手术和化疗相结合。虽然NSCLC的早期检测,诊断和靶向治疗取得了很大进展,但五年生存率仍然很低,根据区域差异和疾病分期从4%到17%不等。患有肿瘤和合并症负担的患者由于未接受有效或特异性治疗而死亡的风险较高。因此,了解NSCLC中的分子机制和鉴定新的治疗靶点至关重要。

miRNA是大约的单链ncRNA长度为20个核苷酸。它们通过转录后与靶基因的mRNA结合在基因表达调控中发挥重要作用。参与细胞分化和体内平衡,miRNA在癌症中发挥关键作用。组织特异性miRNA在癌症的诊断,治疗和预后中起着新的潜在生物标志物的作用。最近,miRNA对肿瘤发生和肿瘤进展的影响受到了极大的关注

MicroRNA-144-3p(miR-144-3p),具有多种功能不同类型癌症中的癌症是与癌症相关的miRNA之一。 MiR-144-3p可作为喉鳞状细胞癌,胃癌,肝细胞癌和胰腺癌的抑制因子。然而,它是肾癌,鼻咽癌和结直肠癌的致癌基因。以前的研究还表明,miR-144-3p通过靶向LC中的TP53诱导型糖酵解和细胞凋亡调节因子(TIGAR)参与细胞增殖,凋亡和自噬。 miR-144-3p的下调通过调节葡萄糖转运蛋白1(GLUT1)导致LC细胞的代谢改变。以前的研究表明,miR-144-3p可能是一种生物标志物,具有巨大的潜力。尽管如此,miR-144-3p对NSCLC起源,分化和凋亡的影响以及miR-144-3p与临床参数之间关系的综合机制却鲜有报道。

本研究调查了两者之间的相关性通过从Gene Expression Omnibus(GEO)微阵列,相关文献,癌症基因组图谱(TCGA)和实时定量实时PCR(RT-qPCR)分析收集的数据收集miR-144-3p表达和临床特征确定临床作用miR-144-3p在NSCLC中。 随后通过使用12个预测程序来预测miR-144-3p靶向的基因来检查NSCLC中的潜在作用机制。 此外,还进行了生物信息学分析,包括基因本体论(GO),京都基因和遗传基因百科全书(KEGG)以及蛋白质 - 蛋白质相互作用(PPI)网络分析。

材料与方法

数据收集

在GEO数据库中对NSCLC中的miR-144-3p进行搜索(http://www.ncbi.nlm.nih.gov/geo/):(MicroRNA OR “Micro RNA” OR “non-coding RNA” OR ncRNA OR “small RNA” OR miRNA) AND (Lung OR pulmonary) AND (cancer OR tumor OR neoplasm OR malignancy OR carcinoma OR adenocarcinoma OR AC OR SCC OR NSCLC). 设置类型为“series”,物种为‘人类’。包含的标准如下:(1)被诊断患有NSCLC及其亚型的患者; (2)包含癌症和非癌样品; (3)癌症和非癌样品至少三个以; (4)可获得miR-144-3p的数据。从PubMed,谷歌学术,中国国家知识基础设施(CNKI),重庆VIP电子(VIP)和中国万方数据库中检索到相关研究。Fig 1显示了该研究的工作流程。

mir-144-3p在TCGA的表达

下载来自癌症基因组图谱TCGA(https://cancergenome.nih.gov/)的MicroRNA-144-3p表达数据用于获得关于miR-144-3p在NSCLC和非癌样品中的表达值的详细信息。使用IBM SPSS Statistics V22.0软件计算NSCLC样品和正常对照中miR-144-3p表达的差异。

Quantitative real-time PCR

对于本研究,125对样本由广西医科大学第一附属医院病理科提供。样本进行福尔马林固定和石蜡包埋(FFPE)以保存。研究得到了医院伦理委员会的批准。接下来,通过RT-qPCR用Applied Biosystems 7900HT快速实时PCR系统软件检测125对配对临床样品中的miR-144-3p表达。 miR-144-3p序列如下:UACAGUAUA GAUGAUGUACU。 2-Δcq的公式用于计算miR-144-3p表达值。

统计分析和meta分析

在miR-144-3p进行log2转化后,使用表达谱分析信息用IBM SPSS Statistics V22.0软件计算每个对照和实验组的数量,平均值(M)和标准偏差(SD)。 此外,Stata 12.0软件用于对来自多个来源(芯片,文献,miRNA测序和RT-qPCR)的数据进行全面的meta分析。 在森林图上显示了NSCLC和无肿瘤标本中miR-144-3p表达的分析,其显示了标准化平均差异(SMD)和95%保密间隔(CI)。 计算Q和I2统计量的卡方检验以评估研究中的异质性,并确定将随机效应模型或固定效应模型应用于合并过程的适当性。 为了测量出版物偏倚,进行了Egger's和Begg's检验以及漏斗图,其显着性为p <0.05。

非小细胞肺癌中microRNA-144-3p的潜在靶基因

MiRWALK2.0是miRNA-target相互作用数据的在线档案,用于预测miR-144-3p靶基因。 其使用具有miRWalk,miRMap,MicroT4,miRNAMap,TargetScan PICTAR2,miRBridge,PITA,miRanda,RNAhybrid,miRDB,RNA22的12个数据库。 只有超过六个数据库认可的靶基因才被认为是靶基因。 LUAD和LUSC中的高表达基因是通过基因表达谱分析互动分析(GEPIA)获得。 LUAD和LUSC中上调基因中的重叠基因和预测的靶基因被视为NSCLC中miR-144-3p的靶基因。对NSCLC中miR-144-3p特异性靶基因的文献进行了综述。通过先前研究确定的靶基因和预测的靶基因,即有希望的靶基因,用​​于功能分析。

靶基因的功能分析

GO,包括生物过程(BP),细胞成分(CCs)和分子功能(MFs),由Metascape(http://metascape.org/gp/)分析。然后使用Metascape工具通过KEGG途径分析阐明潜在靶基因的功能注释。此外,还建立了一个PPI网络,以揭示STRING上潜在靶基因的中枢基因,STRING是一个多基因整合功能的门户网站。

TCGA和GTEx数据库的hub基因的表达

来自TCGA和GTEx的hub基因的表达为了进一步证实hub基因在NSCLC中的功能及其与miR-144-3p的关系,搜索TCGA和基因型组织表达(GTEx)数据库 进行以确定NSCLC中hub基因的表达模式。 通过GEPIA分析了NSCLC和非癌样品中的hub基因。

结果

确认microRNA-144-3p在非小细胞肺癌中的表达和临床价值,

MicroRNA-144-3p在非小细胞肺癌中的表达通过GEO获得

来自GEO数据库的19个geo数据集符合纳入标准。纳入的GEO数据集特征展示在Tbale1中。其中,14个数据集来源于从组织,5个来自血液(GSE27486,GSE40738,GSE64951,GSE93300和GSE114711)。此外,在GEO数据库的下载NSCLC和对照组的表达数据。对于来自组织样本的数据集,NSCLC组的miR-144-3p表达水平显着低于GSE25508,GSE48414,GSE51853,GSE56036,GSE63805,GSE72526,GSE74190和GSE102286中的对照组(p = 0.0202, p <0.0001,p <0.0001,p = 0.0011,p <0.0001,p = 0.0102,p <0.0001,p <0.0001(图2))。相反,在数据集中(GSE14936,GSE29248,GSE36681,GSE47525,GSE53882和GSE77380)之间未检测到miR-144-3p表达在NSCLC和对照组存在显着区别。关于来自血液样品的数据集中,发现了NSCLC中miR-144-3p的表达在GSE27486和GSE40738数据集中显着降低(分别为p = 0.0196,p = 0.0036(图3))。

GEO的meta分析结果

基于来自GEO数据库的19个微阵列进行了荟萃分析。 结果如图4a所示。由于存在显著的异质性(p <0.05,I2=94.3%),因此使用随机效应模型,得到miR-144-3p在NSCLC组中显着下调(SMD = - 0.89; 95%CI - 1.34, - 0.44; p = 0.000) 。 随后进行敏感性分析,以探究是否存在某个数据集在显着异质性中发挥重要作用(图4b)。 在每次荟萃分析中移除单个数据集,并与移除之前的效果进行比较。 没有发现任何单个研究在所有研究中发挥了至关重要的作用。

生成漏斗图以估计偏倚(图4c)。 为了进一步阐明异质性来源,进行了亚组分析。 它基于多种特征:样品来源(组织与血液)和癌症类型(腺癌与鳞状细胞癌)。 如图5所示,在组织亚组中观察到显着的异质性(I2 = 95.8%,p = 0.000)。 在腺癌中也发现了显着的异质性(I2 = 92.9%,p = 0.000)和鳞状细胞癌细胞癌(I2 = 95.3%,p = 0.000)。 这些结果表明,样本来源和癌症类型可能是异质性的来源。

基于癌症基因组图谱数据确认microRNA-144-3p在非小细胞肺癌中的表达和临床效果

MicroRNA-144-3p在非小细胞肺癌组织中的表达和预后价值

TCGA包含376个LUSC患者样本和488个LUAD患者样本。 关于LUSC,与正常对照相比,miR-144-3p表达显着下调(2.8193±1.40600对比5.5678±1.27693,p <0.001(图6a和表2))。 就LUAD而言,miR-144-3p的表达水平明显低于健康组织(2.8959±1.35967对比5.2775±1.64708,p <0.001(图6,表3))。来自LUSC和LUAD的数据进一步合并 检查NSCLC中miR-144-3p的表达。 如图6c和表4所示,miR-144-3p显着降低NSCLC组织与非癌肺组织相比(2.8632±1.37928对比5.4243±1.4702,p <0.0001)。 后来使用Kaplan-Meier曲线来鉴定miR-144-3p的表达对存活时间的影响。 如图所示。 如图7所示,三条Kaplan-Meier曲线的p值均大于0.05,因此表明miR-144-3p水平较低的组与高水平组之间的存活时间无显着差异。

基于癌症基因组图谱数据,microRNA-144-3p与非小细胞肺癌临床病理学的关系

从表2和表3中可以看出,从TCGA下载了332名LUSC患者和445名LUAD患者的临床特征。 关于LUSC,在阶段(p = 0.040)和原发肿瘤(T)(p = 0.035)中发现miR-144-3p的显着差异。 阶段III-IV(2.4469±1.41079)的LUSC患者miR-144-3p的表达低于阶段I-II(2.8878±1.39556)。 T3-T4中LUSC的miR-144-3p表达(2.5088±1.36178)比T1-T2(2.9023±1.40854)更显着地降低。 就LUAD而言,观察到miR-144-3p表达的显着差异(p = 0.031)。 阶段III-IV(3.1868±1.45395)的患者具有更高的miR-144-3p表达值。 基于TCGA的LUAD和LUSC数据汇总用于进一步验证。 如表4所示,T阶段统计学中的显着性基于T3-T4患者中较低的miR-144-3p表达(p <0.05)。

定量实时PCR分析microRNA-144-3p表达及其在非小细胞肺癌预后中的意义

使用RT-qPCR,评估miR-144-3p在125个匹配组织中的临床表达值。 如图8a和表5中所示,NSCLC样品显示miR-144-3p的表达水平显着低于非癌样品(2.808±1.303对比4.813±2.618,p <0.001)。 然后,分析miR-144-3p表达的LUAD和LUSC。 如图8b和c所示,与在相邻的非癌组织中发现的不同,在LUSC和LUAD中观察到明显低表达的miR-144-3p(p = 0.0004,p <0.0001)。 Kaplan-Meier曲线以评估miR-144-3p在LUAD的预后。 如图9所示,表现出较低miR-144-3p表达值的LUAD患者可能有较差的预后(p = 0.397)。

microRNA-144-3p表达与非小细胞肺癌患者临床特征的相关性

NSCLC患者miR-144-3p表达在淋巴结转移和血管侵犯方面存在显着差异(表5)。 miR-144-3p的较低值见于淋巴结转移患者,但未发现无没有它(表5)。血管侵犯患者的miR-144-3p值为2.1400±1.2263,无血管侵犯患者的表达水平为3.0682±1.24395(表5)。为了进一步验证miR-144-3p的相关性和临床病理特征,将NSCLC病例分为LUSC和LUAD组。对于LUSC组(表6),吸烟,血管侵犯或淋巴结转移没有统计学差异。然而,对于LUAD,统计分析表明吸烟,血管侵犯和淋巴结转移的显着差异。与没有血管侵犯的患者相比,血管侵犯患者的miR-144-3p表达值较低。吸烟习惯患者的miR-144-3p表达显着低于没有这种习惯的患者(p = 0.027,表7)。此外,被认为有淋巴结转移的NSCLC患者的miR-144-3p表达明显减少。

基因表达综合,癌症基因组图谱和定量实时PCR数据组合的Meta分析

由于未发现相关研究,来自三个来源(微阵列,miRNA测序和RT-qPCR)的数据包含2264个NSCLC样本和 968非肿瘤样本使用随机效应模型的整合荟萃分析 ,因为它们之间有显著的高异质性(I2 = 95.4%,p = 0.000)。样本个体,NSCLC亚型和样本来源的差异被认为是异质性的来源。 如图10a所示,miR-144-3p的组合SMD为-0.95,95%CI为(-1.37,-0.52),表明在NSCLC组织中表达的miR-144-3p低于正常对照组织。 敏感性分析(图10b)表明研究之间存在显着差异; 然而,没有具体的某个研究对高度异质性有显着影响。 使用Begg's和Egger的测试和漏斗图(图10c)进行发表偏倚的评估。 通常,漏斗图是对称的,并且从Begg和Egger的测试中获得的p值分别为0.833和0.335。 总之,结果表明研究的发表偏倚是可控的

生物信息学分析

有希望的靶基因收集

从miRWALK2.0数据库中筛选至少超过6种算法预测的miR-144-3p靶基因,合计1635个基因。在GEPIA中收集了总共1109个LUAD中过表达的基因,LUSC中共有1922个过表达的基因。交叉后,选择了34个预测的靶基因。 miR-144-3p的四个特异性靶点在之前的相关研究中得到验证(表8)。 TIGAR也称为C12orf5基因。因此,收集了总共37个潜在的靶基因。

基因本体和京都基因和基因组分析百科全书(GO和KEGG)

为进一步解释miR-144-3p靶基因的功能,在Metascape中进行KEGG和GO分析。对于GO分析,使用了三个类别:BP,CC和MF。BP分析结果显示:肾脏系统发育(GO:0072001)和含核碱基的小分子代谢过程(GO:0055086)是前两个途径(图11a)。CC分析结果:潜在的目标差异表达基因(DEG)主要富集在中心粒(GO:0005814),高尔基体膜(GO:0000139)和线粒体包膜(GO:0005740)(图11c)中。 对于MF分析结果,三个显着涉及的项目是:RNA聚合酶II近端启动子序列特异性DNA结合(GO:0000978);辅因子结合(GO:0048037);和转移酶活性,转移糖基(GO:0016757)(图11b)。关于KEGG,前两个富集途径是蛋白质消化和吸收(hsa04974)和甲状腺激素信号传导途径(hsa04919)(图12)。 PPI蛋白质网络分析揭示了五个基因-C12orf5,CEP55,E2F8,STIL和TOP2A-作为hub基因,阈值为6(图13)。

来自TCGA的hub基因的表达

PPI网络中心的五个中枢基因(不包括C12orf5)中,四个基因(CEP55,E2F8,STIL和TOP2A)在 与对照组相比,NSCLC组显著上调(图14)

0 人点赞