ID转换 很多时候你得到的是GENCODE的ID,比如ENSGxxx之类的,怎样转换成gene symbol呢?往下看
一般的教程是这样的
R语言环境下library("AnnotationDbi")library("org.Hs.eg.db")columns(org.Hs.eg.db) #看一下都有什么res
DIY的教程是这样的
上面那个教程可以应对一般情况,比如对新注释的要版本求也不那么高,知道是什么基因就好了。那么有些特殊要求怎么办比如我想看看非编码,想看看最新的注释结果?“少废话,来干货~”首先去下载你要的最新的GTF文件,这个在建立index的时候就用到了,这里强烈建议,有什么建立的index,就用什么区注释你的基因。下载完之后,将GTF拷贝到R语言工作环境biocLite("rtracklayer")library("rtracklayer")myGTF <- "Your_download_GTF_name.gtf"newGTF <- import(myGTF)a<-cbind(newGTFgene_type)colnames(a)<-c("geneid","genename","genetype")res GTF那里你可以DIY,比如有专门的lncRNA的注释文件等等merge之后会用重复,下面的是去除重复的方法
下面按照一般的分析顺序再做一下以往教程总结
1、10元转录组分析:首先你得有个服务器~饿第肾啊~2、10元转录组分析:这次真的是干货了~灰常干3、从零到壹:10元转录组分析~硬盘不够用咋办4、从零到壹:从SRA下载到分析~纯干货5、生信干货~SRA转fastq的教程~补课啦~6、从零到壹:10元~Mapping神器STAR的安装及用7、生信干货~SRA下载后批量处理Counts文件
最近在分析一批数据,用打赏的钱给服务器充值,谢谢诸位公众号日后会有文献和临床部分的更新,希望有更多人一起来维护。