昨天的介绍当中,我们知道了geneshot的其中一个功能,就是通过关键词检索,我们可以知道这个这个领域目前基因研究情况是什么。同时可以预测候选的基因。这次我们来介绍它的其他功能:基因功能预测和基因常见度预测。
Gene Function Prediction: 基因功能预测
通过输入基因名来预测基因的功能。我们可以在多个数据库当中来预测基因的功能,其中包括这个基因的GO和通路分析当中的预测,也可以在转录因子调控和蛋白相互作用当中预测。这个预测的数据库就包括我们之前介绍的ChEA转录调控数据库[数据库推荐]多基因转录因子调控网络预测。GeneShot不只是利用数据库预测基因功能,同时也可以根据之前提到的五个数据库的结果来进行相似性比对,使得结果更加的准确。
这里我们使用 PGC
在ChEA中进行预测,同时和AUTO-RIF的结果进行比对。
在预测的结果当中,首先是包括一个表格,这个表格代表 PGC
在ChEA当中预测到的转录因子调控的结果。表格当中的Known代表结果是否存在与AUTORiFs数据里面。如果为1则为既存在于ChEA结果当中也存在于AutoRif结果当中。同时基于两者重叠的结果来绘制了ROC曲线。
需要注意的是,如果AutoRif的结果少的话,是绘制不出ROC的。
Gene Set Augmentation: 基因研究常见度查询
输入一系列的基因,得到不同基因的研究程度。各个基因的研究程度可以分成rare
; uncommon
; common
; very common
四种。
结果当中,首先我们可以得到的就是这些基因的简单统计。这个统计是基于基因有关的文献来的。数据库认为:如果一个基因有7篇或更少的文章,则很少见。当一个基因有8到25篇文章时,是罕见的。常见基因有26至87篇文章。具有至少88篇文章的的所有基因被认为是非常普遍的。
同时可以得到这些基因的发表文章的数据以及预测到的相互作用的基因。
数据库总结:
基于这次讲到的两个数据库的功能,在我们利用测序或者芯片得到差异表达基因进行下一步候选基因选择的时候可以用到的。首先我们可以看这些差异基因哪些更加罕见。那对于罕见的就是研究少的,相对来说更有创新性,然后对于这些罕见的基因,我们就可以利用预测基因功能的部分来预测这个基因的功能到底是什么,同时有可能和哪些基因有相互作用。