TCGA数据库筛选出有生存意义的lncRNA

2020-04-09 14:15:47 浏览数 (1)

长链非编码RNA(Long non-coding RNA), lncRNA是一类本身不编码蛋白、转录本长度超过200nt的长链非编码RNA分子,它可在多层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达。lncRNA最初被认为是RNA聚合酶II转录的副产物,是一种“噪音”,不具有生物学功能。然而,今年来的研究表面,lncRNA参与了X染色体沉默、染色体修饰和基因组修饰、转录激活、转录干扰、核内运输等过程,其调控作用正在被越来越多的人研究。

据统计,哺乳动物蛋白编码基因占总RNA的1%,长链非编码RNA占总RNA的比例可达4%-9%,这些长链非编码RNA是基因功能研究的又一座宝库。目前发现的许多lncRNA都具有保守的二级结构,一定的剪切形式以及亚细胞定位。它们在基因组上相对于蛋白编码基因的位置,可以分为5种:正义链(sense)、反义链(antisense)、双向(bidirectional)、内含子间(intronic)、基因间(intergenic),其所在的位置与其功能有一定的相关性。

lncRNA的作用机制 长链非编码RNA的作用机制非常复杂,至今尚未完全清楚。根据目前的研究,lncRNA的作用机制如要有以下几种(如图)。

长链非编码RNA(lncRNA)简介

  • 编码蛋白的基因上游启动子区(橙色)转录,干扰下游基因(蓝色)的表达;
  • 抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝色)的表达;
  • 与编码蛋白基因的转录本形成互补双链(紫色),干扰mRNA的剪切,形成不同的剪切形式;
  • 与编码蛋白基因的转录本形成互补双链(紫色),在Dicer酶的作用下产生内源性siRNA;
  • 与特定蛋白质结合,lncRNA转录本(绿色)可调节相应蛋白的活性;
  • 作为结构组分与蛋白质形成核酸蛋白质复合体;
  • 结合到特定蛋白质上,改变该蛋白质的细胞定位;
  • 作为小分子RNA(如miRNA、piRNA)的前体分子。

主要写如何快速的筛选出有生存意义的lncRNA

一般来说lncRNA有一万多个,如何快速的筛选出所有P小于0.05(生存分析)。单因素生存分析,基于TCGA数据库的基因表达矩阵。

  • 注释lncRNA
  • 合并临床数据(生存数据)
  • 快速的筛选分析

0 人点赞