Deseq2 当你得到了Counts数之后应该做的~
Talk Less,Show Dry-Goods
第一步在你的PC或者MAC上安装Rstudio第二步安装deseq2工具并载入source("https://bioconductor.org/biocLite.R")biocLite("DESeq2")library(DESeq2)然后是读取数据,在这里需要说明一下1、读取的数据结构应该是
2、数据可以从txt或者csv等文件直接用read.table/csv读取3、当然如果你看了下面的教程,你会得到data.out这个数据框,按照下面的命令即可得到用于deseq2分析的原始文件data.out1<-data.out[-(1:4),-2]raw.data<-data.out1[,-1]进行条件设置condition<-c(rep('Tumor',50),rep('Normal',50))coldata<- data.frame(row.names=colnames(raw.count), condition)此处要注意raw.count的排序需要与condition顺序一致构建deseq2对象dds <- DESeqDataSetFromMatrix(countData = raw.count,colData = coldata,design = ~ condition)设置对照ddscondition<−relevel(ddscondition<−relevel(ddscondition,'Normal')计算开始,样本量大的话,可以先去干点别的dds <- DESeq(dds)get结果res <- results(dds)设置cutoffresSig <- subset(res.LOXL1AS1, abs(log2FoldChange)>1 & padj < 0.01)输出结果resSig<-data.frame(resSig)write.csv(resSig,file="DEG.csv")这个时候是没有基因名字的,你需要参考下面的教程进行注释。生信干货~ID(ENSGxx)转Gene name的方法~R代码包与练习文件请到Chris生信初级教程中下载