R基础:生信分析的R语言基础教程都在这里了,包括语法,绘图和数据分析。
生物信息数据分析教程视频——01-TCGA数据库RNAseq数据下载与整理
生物信息数据分析教程视频——02-TCGA数据库miRNA数据下载与整理
生物信息数据分析教程视频——03-有关TCGA数据库临床数据的问题
生物信息数据分析教程视频——04-TCGA数据库中SNV和CNV数据的下载
生物信息数据分析教程视频——05-TCGA数据库中甲基化数据的下载和整理
生物信息数据分析教程视频——06-GEO数据库中芯片数据的下载和整理
生物信息数据分析教程视频——07-TCGA数据库:基因的表达探索
生物信息数据分析教程视频——08-TCGA GTEx数据库的数据整理
生物信息数据分析教程视频——09-TCGA GTEx数据库联合表达分析
生物信息数据分析教程视频——10-TCGA数据库:miRNA的表达探索
生物信息数据分析教程视频——11-筛选相关性基因
生物信息数据分析教程视频——12-基因之间的相关性分析及可视化
生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较
生物信息数据分析教程视频——14-芯片数据的表达差异分析
生物信息数据分析教程视频——15-clusterProfiler包 ClueGO做富集分析
生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估
生物信息数据分析教程视频——17-多种算法评估肿瘤免疫细胞浸润水平
18-肿瘤突变负荷(TMB)的计算
代码语言:javascript复制# setwd("G:/MedBioInfoCloud/analysis/TCGA/new/conventionalAnalysis")
options(stringsAsFactors = F)
library(TCGAbiolinks)
library(dplyr)
library(maftools)
FilePath <- dir("G:/MedBioInfoCloud/analysis/TCGA/new/processedTCGAdata/TCGA-SNV/",
"SNV.Rdata$",full.names = T)
###TCGA数据库中33中癌症类型
project <- getGDCprojects()$project_id
project <- project[grep("TCGA-",project)]
opt <- "output/011-MATH/"
ifelse(dir.exists(opt),FALSE,dir.create(opt,recursive = T))
for(proj in project){
message("===============================")
message(proj)
load(FilePath[grep(proj,FilePath)])#STARdata
maf <- read.maf(snv,isTCGA=TRUE)
#mutant-allele tumor heterogeneity
barcode <- unique(maf@data$Tumor_Sample_Barcode)
MATH <- data.frame()
for (i in barcode){
out.math = inferHeterogeneity(maf = maf, tsb = i)
Tumor_Sample_Barcode <- unique(out.math$clusterData$Tumor_Sample_Barcode)
m = unique(out.math$clusterData$MATH)
out = data.frame(Tumor_Sample_Barcode, m)
MATH = rbind(MATH, out)
}
save(MATH,file = paste0(opt,proj,"-MATH.Rdata"))
}
参考:
生物信息数据分析教程视频——04-TCGA数据库中SNV和CNV数据的下载
肿瘤突变负荷(TMB)与等位基因突变的肿瘤异质性(MATH)分数的计算