原视频6:测序质量的控制
首先建立文件夹
代码语言:javascript复制$ cd ~/project/wes/
$ mkdir {raw,clean,align,mutation,qc}
这部分包括fastqc和multiqc两个软件查看测序质量,以及使用trim_galore软件进行过滤低质量reads和去除接头。
1 QC
1.1 fastqc
没有原视频中文件,我用了下载的三个文件做例子。乳腺癌的组织样本。所以原视频中命令我也用不上,但是还是列出来
代码语言:javascript复制find /public/project/wes/raw_data -name *.gz|grep -v '._'|xargs fastqc -t 10 -o ./
想知道为什么要-v ._
,去看原视频中的文件命名。
我的文件没那么复杂,可以下面这样
代码语言:javascript复制$ find SRR851819*.gz|xargs fastqc -t 20
-t 20 一次运行20个文件。
如果你有很多很多文件,参考我这篇批量对多个测序文件进行fastqc.
1.2 multiqc
代码语言:javascript复制
假设上述qc发现,质量不好,就过滤
2 过滤低质量reads和去接头
代码语言:javascript复制ls /path/to/your/directory/*_1.fastq.gz >1
ls /path/to/your/directory/*_2.fastq.gz >2
paste 1 2 > config
也可以用
ls|grep >
打开qc.sh,写入以下内容
代码语言:javascript复制source activate wes
bin_trim_galore=trim_galore
dir='/home/kelly/project/wes/clean'
cat.config |while read id
do
arr=(${id})
fq1=${arr[0]}
fq2=${arr[1]}
nohup $bin_trim_galore -q 25 --phred33 --length 36 -e 0.1 --stringency 3 --paired -o $dir $fq1 $fq2 &
done
运行上面脚本就可以了。