miRNA 靶向预测软件targetscan

2020-08-06 14:20:00 浏览数 (1)

01

Targetscan靶向预测思想

TargetScan 基于序列互补原则,找到比对到靶 3'UTR 的保守性 8 mer、7 mer 或 6 mer 位点(seed match 序列),进一步根据热力学稳定性筛选得到 miRNA 的靶。seed 序列配对主要考虑三种类型:7 mer-1a(miRNA 的第 2-7nt 与靶基因互补配对, 而且 UTR 上与 miRNA 1nt 互补配对的位置是 A);7 mer-m8 (miRNA 2-8nt 与靶基因完全配对);8 mer (miRNA 2-8nt 与靶基因完 全配对,而且 UTR 上与miRNA 1nt 互补配对的位置是 A)。

由于很多通过保守的 seed match 序列找到的 target 不一定具有功能,而且有很多与靶基因配对的不具备保守性的 seed match 区域也找到了一些有功能的 miRNA 靶位点。targetscan 考虑到这点提出了seed match周围序列也会影响 miRNA 的靶功能,引入了 context score。主要包括如下几部分:

Site Type 8 mer > 7 mer-m8 > 7 mer-1a;

3' pairing contribution:除了与 miRNA seed 区域配对,与 miRNA12-16nt 的配对也有可能对 miRNA target 的功能产生影响;

local AU contribution:AU rich 的区域更有可能有功能;

position contribution:miRNA 靶位点至少离终止密码子15nt,且功能性 site 更可能位于 UTR 两端而不是中间,中间往往存在复杂二级结构不利于靶位点结合。

考虑这些因素后,对于不具备保守性的 seed match 区域也可以计算相应的 context score。将保守和不保守区域的 context score 进行排序即得到 context score percentile。一般考虑 context score percentile > 90 为预测的可能具有功能的 miRNA 的靶。

02

Targetscan 预测所需文件准备

step 1、首先需要准备两个文件:miRNA 的 fa 序列以及 target 的 fa 序列文件。

step 2、将上述文件转换为 targetscan 预测需要的格式。

其中 miRNA 的序列文件转换为如下格式(任意一种均可):

格式 1:包含四列,分别是:miRNA 家族、物种 ID、miRBase 的 ID、成熟的 miRNA 的序列。

格式 2:包含三列,分别是:miRBase 的 ID、成熟的 miRNA 的第一到第七位的序列、物种 ID。

target 的 fa 序列转换为如下格式,即包含三列:ID、物种 ID、序列。

03

Targetscan 结果文件解读

结果文件命名为:targetscan.context.txt。其中标题各列的含义如下:

Gene ID:基于 ID

Species ID:物种 ID

Mirbase ID:miRbase 中 miRNA 的 ID

Site Type:配对类型(8mer、7 mer-m8、7 mer-1a)

UTR start:UTR 起始位置

UTR end:UTR 终止位置(起始和终止的长度大概是 6nt)

3' pairing contribution : 3' 端配对的贡献值

local AU contribution : AU rich 区域的贡献值

position contribution : 结合位点的贡献值

context score :考虑其他因素对靶基因预测的影响后计算得到的得分(累积加权后的得分)

context score percentile:排序后的得分

UTR region :UTR 区域的序列

UTR-miRNA pairing :miRNA 与 UTR 互补配对的区域

mature miRNA sequence :成熟的 miRNA 序列

miRNA family:miRNA 家族

参考文献:

Conserved Seed Pairing, Often Flanked by Adenosines, Indicates that Thousands of Human Genes are MicroRNA Targets

0 人点赞