chip_seq质量评估之coverage分析

2019-12-19 15:26:35 浏览数 (1)

欢迎关注”生信修炼手册”!

peak calling的核心是比较input和抗体处理样本基因组区域测序深度分布的差异,所以样本的测序深度分布可以作为质控的一个标准,本文介绍如何通过deeptools来绘制样本测序深度分布图。

通过plotCoverage命令,可以绘制样本测序深度的分布,由于测序量较大,为看节省运行时间,默认随机抽取10M的reads,来计算测序深度的分布,基本用法如下

代码语言:javascript复制
plotCoverage 
-b H3K4Me1.bam H3K4Me3.bam H3K27Me3.bam H3K9Me3.bam
--plotFile example_coverage 
-n 1000000 
--plotTitle "example_coverage" 
--outRawCounts coverage.tab 
--ignoreDuplicates 
--minMappingQuality 10

输出结果示意如下

左侧是测序深度频率分布图,右侧是大于该测序深度的频率分布图, 以H3K4Me1这个样本为例,左侧图中横坐标为2的位置,对应纵坐标约为0.05,说明测序深度为2的区域包含了5%的reads,右侧图中横坐标为2的位置,对应的纵坐标约为0.15, 说明在基因组上有15%的区域测序深度都大于等于2。

这种频率分布图单个样本实际上意义不大,主要是通过多个样本的比较,查看是否有某个样本和其他样本差距很大,从而判断离群值样本。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

0 人点赞