ID转换 很多时候你得到的是GENCODE的ID,比如ENSGxxx之类的,怎样转换成gene symbol呢?往下看
一般的教程是这样的
R语言环境下library("AnnotationDbi")library("org.Hs.eg.db")columns(org.Hs.eg.db) #看一下都有什么res
DIY的教程是这样的
上面那个教程可以应对一般情况,比如对新注释的要版本求也不那么高,知道是什么基因就好了。那么有些特殊要求怎么办比如我想看看非编码,想看看最新的注释结果?“少废话,来干货~”首先去下载你要的最新的GTF文件,这个在建立index的时候就用到了,这里强烈建议,用什么建立的index,就用什么去注释你的基因。下载完之后,将GTF拷贝到R语言工作环境biocLite("rtracklayer")library("rtracklayer")myGTF <- "Your_download_GTF_name.gtf"newGTF <- import(myGTF)a<-cbind(newGTFgene_type)colnames(a)<-c("geneid","genename","genetype")res GTF那里你可以DIY,比如有专门的lncRNA的注释文件等等merge之后会有重复,下面的是去除重复的方法
小站
星球介绍
1、Chris课题和文章辅导:那位佛系热心给予正能量的师兄,在这里~ 2、Chris生信初级教程:从建服务器开始的转录组分析在线直播课程 3、Chris带你玩转TCGA:干货~Chris带你玩转TCGA~新课预售:Chris带你挖掘环状RNA:云服务器还是本地服务器,这是一个问题,SRA中挖掘环状RNA是另外一个问题凡是加入1、2、3星球的老学员,环状RNA的课预售价基础上再打85折并送所有课程等值的网易云课堂优惠券。