在The ENCODE Blacklist: Identification of Problematic Regions of the Genome (https://www.nature.com/articles/s41598-019-45839-z) 这篇文章中,定义了基因组中的blacklist区域,即反常的或者无论在二代测序的哪个实验中都是高信号的区域。排除掉这些区域对我们进一步分析功能基因组数据可以提供质量保证。
文章中提供了一个blacklist区域和正常区域的比较:
example
在blacklist区域信号非常高,要达到background的 6400×左右。
blacklist区域的统计:
现在有ce10, ce11, dm3, dm6, hg19, hg38和mm10的blacklist region,可以在以下网站下载: https://github.com/Boyle-Lab/Blacklist/; https://www.encodeproject.org/annotations/ENCSR636HFF/