R语言之FASTQ文件操作及质量评估

2019-07-31 16:03:19 浏览数 (2)

今天为大家介绍下如何用R语言进行FASTQ文件的操作。这个包可以对reads进行过滤整理,整理,并且还可以形成质量评估报告。接下来我们看下怎么去使用这个包。首先是包的安装,还是通过bioconductor进行安装:

source("https://bioconductor.org/biocLite.R")

biocLite("ShortRead")

成功载入后如下图:

然后我们看下包中的主要函数:

1. readFastq 读取FASTQ的.gz的文件。

Eg: reads <- readFastq(system.file(package="ShortRead","extdata","E-MTAB-1147","ERR127302_1_subset.fastq.gz"))

2. sread 读取fastq文件中的序列信息。

Eg:sequences=sread(reads)

3. id获取文件中的ID信息。

Eg:id(reads)

4. qa 获取序列的质量评估报告。

Eg:qa <-qa(system.file(package="ShortRead","extdata","E-MTAB-1147"),"fastq.gz")

5. report生成质量评估报告。

Eg:report(qa)#会自动生成一个网页版的质量评估报告

以下是质量评估报告的其中一个主要的图:

欢迎大家学习交流!

0 人点赞