简读分享 | 尹成林 编辑 | 李仲深
论文题目
Identifying and correcting repeat-calling errors in nanopore sequencing of telomeres
论文摘要
纳米孔长读长测序是研究基因组的一种新兴方法,包括长重复元素,如端粒。作者发现了跨纳米孔数据集、测序平台、碱基识别器和碱基识别模型的端粒重复序列中广泛的碱基识别错误,包括许多生物体中的端粒经常被错误判别。作者开发了纳米孔碱基识别模型可以改善端粒区域的恢复和分析,而对其他基因组区域的负面影响最小。作者认为工作中在长、重复和定义不明确的区域中验证纳米孔碱基调用是十分重要的。论文同时展示如何通过改进纳米孔碱基调用模型来解决伪影。
论文链接
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02751-6