R语言实现测序原始数据的文件转化

2019-07-31 11:22:41 浏览数 (1)

了解测序的同志们应该都知道有很多格式的原始文件,同时在转化过程中很是麻烦。今天我们给大家介绍一个R包,它可以进行对原始数据的读取,同时并且可以导出时进行转化格式。

闲话少说,我们开始我们的介绍,首先我们还是看下它的安装,那就很简答了,直接install.packages(‘rtracklayer’)就可以进行安装。

接下来我们看下它导入数据的函数import。其支持以下的格式:GFF, BED, Bed15, bedGraph, WIG, BigWig。最终将以上的数据都转化为GRange的数据形式进行计算。

具体的实例:

track <-import(system.file("tests", "v1.gff", package ="rtracklayer"))

test<- import( system.file("tests", "test.bed",package ="rtracklayer"))

gr <- import(system.file("tests", "test.bw",package ="rtracklayer"))

我们的track读出来接下来就是导出。它提供了export函数进行数据的导出,导出格式可以时方便Rasmtools识别的bam文件也可以时方便VariantAnnotation注释的vcf文件。

实例:export(track, ‘gtf.gff3’, "gff3")#参数依次是数据object,文件名称,文件格式

在这个R报还提供了UCSC的基因组浏览。可以将导入的track进行浏览。

具体的实例如下:

Session=browserSession("UCSC")#链接UCSC数据库

browserView(session,GRangesForUCSCGenome("hg19","chr2", IRanges(20000, 50000)))#读取20000-50000这段序列的具体情况。

结果会显示在浏览器中:

本结果同时支持下载。

0 人点赞