长读长序列比对

2022-10-25 19:22:51 浏览数 (1)

一、minimap2 比对

随着三代测序技术的发展,目前已经开发出多款适用于三代测序数据的比对软件,例如minimap2,ngmlr,blasr 等。

Minimap2 是知名比对工具 BWA 的开发者李恒新开发的比对工具,主要功能就是将测序得到的 DNA 或者 RNA 序列快速比对到参考基因组上。bwa 主要适用于 illumina 等短序列的比对,而 Minimap2 是专门针对 PacBio 或 OXford Nanopore 测序得到的数据开发的软件。

MiniMap2:https://github.com/lh3/minimap2

NGMLR:https://github.com/philres/ngmlr

last :http://last.cbrc.jp/

GraphMap:https://github.com/isovic/graphmap

MarginAlign:https://github.com/benedictpaten/marginAlign

输入文件为测序的 reads,一般为 fastq 或者 fasta 格式,参考基因组,一般为 fasta 格式。minimap2 也可以直接进行基因组之间的比对。minimap2 可以输出 paf 格式以及 sam 格式,默认为 paf 格式。不过下游变异检测工具一般支持的是 sam(bam)格式,我们需要选择输出 sam(bam)格式。

minimap2 比对与其他短序列比对类似,也是需要经过两个步骤。首先,建立索引;第二步,比对。虽然现在软件也支持自动建立索引,整个比对可以一步完成。但是对于较大的基因组比对,最好还是建立索引,这样可以提高比对效率。

二、minimap2 比对练习

代码语言:javascript复制
#minimap2建立索引
minimap2 mgh78578.fasta -d mgh78578.min
#minimap2比对
time minimap2 -ax map-ont mgh78578.min /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz -t 12 -o mgh78578_ont.sam

#pacbio比对
time minimap2 -ax map-pb mgh78578.fasta /share/home/xiehs/05.assembly/data/pacbio.sra.fastq.gz -t 12 -o mgh78578.pb.sam 2> minimap2.log 

#短序列比对
minimap2 -sr mgh78578.fasta /share/home/xiehs/05.assembly/data/illumina.sra_1.fastq.gz /share/home/xiehs/05.assembly/data/illumina.sra_2.fastq.gz -t 12 -o mgh78578.ill.sam

#reads直接比对,找overlap
minimap2 -x ava-ont /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz > ovlp.paf 

#序列比对
minimap2 -x asm5 ref.fna mgh78578.fasta -o mgh78578_ref.paf

#ngmlr比对,速度慢些
ngmlr -t 12 -r mgh78578.fasta -q /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz -o ngmlr.sam -x ont

#paf文件可视化
https://tom-poorten.shinyapps.io/dotplotly_shiny/

写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。

代码语言:javascript复制
sx.voiceclouds.cn

有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。

0 人点赞