欢迎关注”生信修炼手册”!
对于de novo motif分析而言,我们只需要提供序列就可以了。由于peak的长度范围存在一定的波动,通常选取peak中心,即峰值两侧固定长度的序列用于下游的motif分析。
同时为了提高运行效率,有时还会只挑选部分peak进行分析,比如按照p值或者富集倍数挑选最显著的1000个peak的序列来进行motif预测。准备好输入序列之后,就可以进行motif分析了。meme
是一款最常用的工具,网址如下
http://meme-suite.org/tools/meme
操作简单,只需要上传序列,然后设置几个参数值就可以了
输出文件包含了两个部分的结果
1. motif
提供了motif的sequence logo, PFM, PWM矩阵等信息
2. motif location
提供了motif在输入序列上的位置信息,示意如下
在线工具最大支持80M的输入序列,更大的文件就需要本地版软件来运行,基本用法如下
代码语言:javascript复制meme
input.fna
-oc out_dir
-dna
-mod zoops
-nmotifs 3
-revcomp
meme
的算法使得这个工具可以同时得到motif和motif在输入序列上的位置两种信息,在输出多个motif时,在输入序列上sites越多的motif优先输出,所以通常情况下只需要参考前3个motif就可以了,该工具更适用于motif种类较少的场景,比如分析某个转录因子的chip_seq或者m6A_seq的数据。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!