欢迎关注”生信修炼手册”!
peak calling的核心是比较input和抗体处理样本基因组区域测序深度分布的差异,所以样本的测序深度分布可以作为质控的一个标准,本文介绍如何通过deeptools来绘制样本测序深度分布图。
通过plotCoverage
命令,可以绘制样本测序深度的分布,由于测序量较大,为看节省运行时间,默认随机抽取10M的reads,来计算测序深度的分布,基本用法如下
plotCoverage
-b H3K4Me1.bam H3K4Me3.bam H3K27Me3.bam H3K9Me3.bam
--plotFile example_coverage
-n 1000000
--plotTitle "example_coverage"
--outRawCounts coverage.tab
--ignoreDuplicates
--minMappingQuality 10
输出结果示意如下
左侧是测序深度频率分布图,右侧是大于该测序深度的频率分布图, 以H3K4Me1
这个样本为例,左侧图中横坐标为2的位置,对应纵坐标约为0.05,说明测序深度为2的区域包含了5%的reads,右侧图中横坐标为2的位置,对应的纵坐标约为0.15, 说明在基因组上有15%的区域测序深度都大于等于2。
这种频率分布图单个样本实际上意义不大,主要是通过多个样本的比较,查看是否有某个样本和其他样本差距很大,从而判断离群值样本。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!