介绍
- SAM(sequence Alignment/mapping) 数据格式是目前高通量测序中存放比对数据的标准格式
- 转换 BAM 与 SAM 格式
- 比对文件排序,建立fastq索引
安装
conda install -y samtools
这里需要安装Conda (这是一款用于安装多数生物信息分析软件的管理软件,重要的是可以解决软件依赖问题) : Conda 安装使用图文详解
使用
1、常用的三个步骤
转换 SAM 格式为 BAM 格式
samtools view -S SRR00000.sam -b > SRR00000.bam
对比对后文件进行排序
samtools sort SRR00000.bam -o SRR00000_sorted.bam
对排序后文件建立索引
samtools index SRR00000_sorted.bam
通常以上的三个步骤是依次进行
2、格式转换
sam -> bam
samtools view -S SRR00000.sam -b > SRR00000.bam
bam -> sam
samtools view -h SRR00000.bam -b > SRR00000.sam
文档:http://www.htslib.org/doc/samtools.html