使用DREME挖掘序列中的de novo motif

2019-12-19 15:50:49 浏览数 (1)

欢迎关注”生信修炼手册”!

DREME也是一款常用的de novo motif分析软件,它具有以下几个特点

  • 只支持核酸序列,即DNA和RNA序列的motif分析,不支持氨基酸序列
  • DREME需要两个序列集合,其中一个作为control,主要功能是挖掘相比control, 在另外一个集合中相对富集的motif

将contorl对应的序列集合称之为negative sequences, 将另一组称之positive sequences,采用费舍尔精确检验分析motif在positive出现的次数是否比negative中出现的次数更多。

如果你只提供了一个序列集合,则采用碱基随机抽样的方式根据你提供的序列模拟出一组contorl序列,这种方式构建的序列集合也称之为shuffled sequences。

在线工具的网址如下

http://meme-suite.org/tools/dreme

同时提供control和input序列集合就可以了,需要注意的是,两个集合中的序列个数必须一致,序列的长度在100bp左右最佳, 通常采用peak中心上下游各50bp的序列即可。

输出结果如下所示

同时在输入的序列和其反向互补链上查找motif, 输出结果中RC Logo代表反向互补链上的motif。点击每个More可以查看每个motif的具体信息,示意如下

给出了该motif和对应的碱基组合在两个序列集合中次数的个数统计和对应的p值等信息,需要注意的是,这里的个数统计不是简单的统计该字符在输入序列中出现的次数,而且在分析总的motif和对应的各种碱基组合的次数时是独立的操作,所以不是说每种碱基组合的次数叠加就是总的motif的次数。

DREME对应的命令行版本的基本用法如下

代码语言:javascript复制
dreme -oc out_dir -png -p input.fa

DREME适用于发现长度在3-8bp之间的motif, 而MEME的motif长度可以通过参数调整,适用范围更大。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

0 人点赞