PAVIS是一个在线工具,可以对peak区间与基因组各个特种的overlap情况进行注释,网址如下
在chip_seq数据分析中,peak calling是核心,得到peak区间之后,我们首先需要对peak进行注释。所谓的注释其实是一个比较宽泛的概念,其中包含了以下多种类型的注释信息...
HOMER是一款进行motif预测的软件,除此之外,该软件还集成了许多其他功能,可以识别用于分析chip_seq,RNA_seq,Hi-C等数据。本文主要介绍如何通过HOMER来进行peak calling。...
chip_seq数据中peak的长度范围跨度较大,既有覆盖几个核小体的几百bp的peak, 也有包含多个基因长度在上千kb的peak。比如H3K4me2和H3K4me3这两种组蛋白修饰中peak在几百bp左右, 而H3K27me3中则为长度在几十到几百kb之间...
在使用macs进行peak calling时,除了输入样本对应的BAM/SAM文件之外,还可以输入BED文件。BAM文件我们都非常 熟悉,将序列比对到基因组之后就可以产生这样的文件,各个比对软件也支持输出BAM/SAM格式。这种格式的文件记录了...
MACS是一款最为流行的peak calling软件,最初是针对转录因子的chip数据来设计的,在最新版本中,也添加了对组蛋白修饰的适配。目前最新版本为v2.0,官网如下...
NRF代表的是非冗余reads的比例,与参考基因组比对之后,我们可以得到所有比对上的reads, 其中有一部分是unique mapping的reads, 这些reads唯一比对到基因组上的一个位置,NRF就是unique mapping reads除以total mapped re...
ENCODE官方提供了chip_seq分析的pipeline以供参考,在peak calling前的预处理环节,流程示意如下
在chip_seq数据分析中,通常会对peak区域在基因组上的分布进行探究,查看其分布是否存在规律,比如是否在转录起始位点,或者转录终止位点附近存在富集,此时我们可以通过deeptools这个工具来实现。...
通过UCSC基因组浏览器,我们不仅可以查看别人已经公布的数据,还可以上传自己的数据进行查看,支持以下bed,vcf,bigwig等多种常见的文件格式,完整的格式列表请参考以下链接...