3 wes测序质量的控制

2019-06-03 10:53:07 浏览数 (2)

原视频6:测序质量的控制

首先建立文件夹

代码语言:javascript复制
$ cd ~/project/wes/
$ mkdir {raw,clean,align,mutation,qc}

这部分包括fastqc和multiqc两个软件查看测序质量,以及使用trim_galore软件进行过滤低质量reads和去除接头。

1 QC

1.1 fastqc

没有原视频中文件,我用了下载的三个文件做例子。乳腺癌的组织样本。所以原视频中命令我也用不上,但是还是列出来

代码语言:javascript复制
find /public/project/wes/raw_data -name *.gz|grep -v '._'|xargs fastqc -t 10 -o ./

想知道为什么要-v ._,去看原视频中的文件命名。

我的文件没那么复杂,可以下面这样

代码语言:javascript复制
$ find SRR851819*.gz|xargs fastqc -t 20

-t 20 一次运行20个文件。

如果你有很多很多文件,参考我这篇批量对多个测序文件进行fastqc.

1.2 multiqc

代码语言:javascript复制

假设上述qc发现,质量不好,就过滤

2 过滤低质量reads和去接头

代码语言:javascript复制
ls /path/to/your/directory/*_1.fastq.gz >1
ls /path/to/your/directory/*_2.fastq.gz >2
paste 1 2 > config

也可以用

ls|grep >

打开qc.sh,写入以下内容

代码语言:javascript复制
source activate wes
bin_trim_galore=trim_galore
dir='/home/kelly/project/wes/clean'
cat.config |while read id
do
         arr=(${id})
         fq1=${arr[0]}
         fq2=${arr[1]}
nohup $bin_trim_galore -q 25 --phred33 --length 36 -e 0.1 --stringency 3 --paired -o $dir $fq1 $fq2 &
done

运行上面脚本就可以了。

0 人点赞