R语言之heatmap绘制

2019-07-31 15:32:27 浏览数 (1)

在基因的表达模式分析中,我们往往需要对量化的多个基因表达数据进行可视化处理,使得我们所关注的基因在物种的不同组织以及同一组织的不同处理下的表达情况一目了然。在日常研究中,我们往往习惯于选择热图实现这一基因表达模式可视化的需求,进而直观的表述我们的基因表达模式的分析结果。今天我们介绍关于R语言绘制热图的一种方法,那就是利用pheatmap包进行热图的绘制。

1 安装pheatmap包有两种方式:

a.install.packages(“pheatmap”)

b. 通过bioconductor安装:

source("http://biocoundctor.org/biocLite.R") biocLite("pheatmap")

2 R包的调用: library(pheatmap)。

3 热图的绘制函数就是pheatmap函数,对其参数做以下介绍:

官方的参数初始情况如下图:

我们看到它的参数设置和其他的heatmap绘制函数基本一致。那么我们今天主要讲里面几个主要的参数,具体的热图绘制,调用函数的时候注意以下参数默认值即可。

1. color = colorRampPalette(rev(brewer.pal(n= 7, name = "RdYlBu")))(100)

主要是设置heatmap中每个格子的颜色以及颜色的过渡范围。

2. cellwidth = NA, cellheight = NA

设置heatmap中每个格子的宽度和高度。

3. scale = "none"

其参数有三种:row,column,none(默认)。此参数的意义就是所有的参与热图的数值是否做Z-score处理,并且是对数值的每一列处理还是每一行处理。

4. cluster_rows = TRUE,cluster_cols = TRUE

对于行列的数据是否做聚类,TRUE做聚类,反之不做。

5. cutree_rows = NA, cutree_cols =NA

此参数是将热图的行列分成几块,并相互独立开。

6. annotation_row = NA,annotation_col = NA

此参数是指对于行列的注释名称是否设置,当然这里设置名称需要以因子的形式设置

例:annotation_row = data.frame(

GeneClass = factor(rep(c("Path1", "Path2", "Path3"),c(10, 4, 6)))

)

annotation_col = data.frame(

CellType = factor(rep(c("CT1", "CT2"), 5)),

Time = 1:5

)

7. annotation_names_row = TRUE,annotation_names_col = TRUE

此参数是指是否显示我们设置的行列的名称,比如上面设置的列名称CellType。

8. annotation_colors = NA

此参数的功能是设置行列每个因子对应的颜色设置,默认也会提供颜色,只是可能不是自己所要,举例其设置形式:

ann_colors = list(

Time =c("white", "firebrick"),

CellType =c(CT1 = "#1B9E77", CT2 = "#D95F02"),

GeneClass =c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 ="#66A61E")

)

那么,展示一个已画好的热图,供大家参考,具体的代码自行发挥。毕竟绘制heatmap一个函数就可以了。

欢迎大家学习交流

0 人点赞