代码语言:javascript复制
library("TxDb.Hsapiens.UCSC.hg19.knownGene")
library("GenomicFeatures")
#org.Hs.eg.db数据对象里面包含着各大主流数据库的数据,一般人都比较熟悉的entrez ID 和ensembl 数据库的ID。
library("org.Hs.eg.db")
txdb <- TxDb.Hsapiens.UCSC.hg19.knownGene
gene=genes(txdb) #提取23056个基因信息,数据以Grangs格式显示。
exon=exons(txdb) #提取exons信息,共289969个exon。
trans=transcripts(txdb) #提取转录本信息,共82960个转录本。
cds=cds(txdb) #获取cds区域信息,提取到237533个cds信息。
Tran_gene=transcriptsBy(txdb,by="gene") #通过基因分组获取每个基因的转录本信息。分成了23459个元素的list。
Exon_gene=exonsBy(txdb,by="gene") #基于基因进行外显子区域信息获取。
Cds_gene=cdsBy(txdb,by="gene") #基于基因的CDS区域信息获取。
gene1=mcols(gene) #mcols 函数可以查看GRanges object右边的metadata column