一、minimap2 比对
随着三代测序技术的发展,目前已经开发出多款适用于三代测序数据的比对软件,例如minimap2,ngmlr,blasr 等。
Minimap2 是知名比对工具 BWA 的开发者李恒新开发的比对工具,主要功能就是将测序得到的 DNA 或者 RNA 序列快速比对到参考基因组上。bwa 主要适用于 illumina 等短序列的比对,而 Minimap2 是专门针对 PacBio 或 OXford Nanopore 测序得到的数据开发的软件。
MiniMap2:https://github.com/lh3/minimap2
NGMLR:https://github.com/philres/ngmlr
last :http://last.cbrc.jp/
GraphMap:https://github.com/isovic/graphmap
MarginAlign:https://github.com/benedictpaten/marginAlign
输入文件为测序的 reads,一般为 fastq 或者 fasta 格式,参考基因组,一般为 fasta 格式。minimap2 也可以直接进行基因组之间的比对。minimap2 可以输出 paf 格式以及 sam 格式,默认为 paf 格式。不过下游变异检测工具一般支持的是 sam(bam)格式,我们需要选择输出 sam(bam)格式。
minimap2 比对与其他短序列比对类似,也是需要经过两个步骤。首先,建立索引;第二步,比对。虽然现在软件也支持自动建立索引,整个比对可以一步完成。但是对于较大的基因组比对,最好还是建立索引,这样可以提高比对效率。
二、minimap2 比对练习
代码语言:javascript复制#minimap2建立索引
minimap2 mgh78578.fasta -d mgh78578.min
#minimap2比对
time minimap2 -ax map-ont mgh78578.min /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz -t 12 -o mgh78578_ont.sam
#pacbio比对
time minimap2 -ax map-pb mgh78578.fasta /share/home/xiehs/05.assembly/data/pacbio.sra.fastq.gz -t 12 -o mgh78578.pb.sam 2> minimap2.log
#短序列比对
minimap2 -sr mgh78578.fasta /share/home/xiehs/05.assembly/data/illumina.sra_1.fastq.gz /share/home/xiehs/05.assembly/data/illumina.sra_2.fastq.gz -t 12 -o mgh78578.ill.sam
#reads直接比对,找overlap
minimap2 -x ava-ont /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz > ovlp.paf
#序列比对
minimap2 -x asm5 ref.fna mgh78578.fasta -o mgh78578_ref.paf
#ngmlr比对,速度慢些
ngmlr -t 12 -r mgh78578.fasta -q /share/home/xiehs/05.assembly/data/nanopore.sra.fastq.gz -o ngmlr.sam -x ont
#paf文件可视化
https://tom-poorten.shinyapps.io/dotplotly_shiny/
写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。
代码语言:javascript复制sx.voiceclouds.cn
有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。