我们在遇到一些新的蛋白的时候,经常需要去了解这个蛋白的功能。如果是一个新的还没有功能注释的蛋白,一般数据库就用不了了。这个时候就可以使用 NetGo 来对蛋白的序列进行功能注释了。
NetGo基于三重信息来对蛋白序列进行功能预测:
- 基于已知的功能信息信息(GO数据库)
- 基于STRING蛋白相互作用数据库进行注释
- 如果没有互作蛋白的可以进行同源转换进行注释。
PS: 官网说这么多,其实也就是想说明NetGO对于功能预测会好。。。
fasta序列
数据库需要输入一个FASTA
序列的氨基酸序列即可。所谓的fasta
序列就是在我们知道的氨基酸序列前面加一行>注释信息
。例如:
> RNF180
MSSMSSAEEQFQWQSQDGQKDIEDELTTGLELVDSCIRSLQESGILDPQDY
第一行的东西只是告诉电脑,我们输入那些序列的是什么东西。
输入
具体操作就是在下图的地方输入我们想要进行预测的序列即可。
最后点击submit
结果展示
对于功能的预测。数据库也是按照GO分析的分析分成了:分子功能(MF),生物学过程(BP)以及细胞组分(CC)。对于每一个预测的结果。也根据不同的得分加上了不同的颜色。
对于每一个结果都是展示也分成了图片和图表。
- 图片可以看到整个GO分析的结果当中的层级关系
- 表格则是结果的另一种形式而已。
数据库评价
对于蛋白功能预测的话,已知的蛋白基本上都已经基于GO预测好了。如果我们研究的是已知常规蛋白的话,其实可以去类似Genecards或NCBI的gene数据库直接看的。这个数据库更多的可以用于新发现的蛋白的预测,或者说一个基因不同转录本之间的研究,看有没有功能的区别。