今天为大家介绍下如何用R语言进行FASTQ文件的操作。这个包可以对reads进行过滤整理,整理,并且还可以形成质量评估报告。接下来我们看下怎么去使用这个包。首先是包的安装,还是通过bioconductor进行安装:
source("https://bioconductor.org/biocLite.R")
biocLite("ShortRead")
成功载入后如下图:
然后我们看下包中的主要函数:
1. readFastq 读取FASTQ的.gz的文件。
Eg: reads <- readFastq(system.file(package="ShortRead","extdata","E-MTAB-1147","ERR127302_1_subset.fastq.gz"))
2. sread 读取fastq文件中的序列信息。
Eg:sequences=sread(reads)
3. id获取文件中的ID信息。
Eg:id(reads)
4. qa 获取序列的质量评估报告。
Eg:qa <-qa(system.file(package="ShortRead","extdata","E-MTAB-1147"),"fastq.gz")
5. report生成质量评估报告。
Eg:report(qa)#会自动生成一个网页版的质量评估报告
以下是质量评估报告的其中一个主要的图:
欢迎大家学习交流!