R tips:使用enframe和map2优雅的迭代列表

2020-06-02 10:22:07 浏览数 (1)

在R中更易于处理的数据形式是data.frame,list并不是太好处理,常用操作就是对它进行循环迭代。

比如,构建如下list:

代码语言:javascript复制
library(tidyverse)
library(magrittr)
test <- list(norm = rnorm(10,0,1),
             unif = runif(10,-1,1),
             pois = rpois(10,1))
test
#$norm
# [1]  0.30288746 -0.16133633  0.82184522 -0.04186266 -0.41756076 -0.36109442  0.26533605
# [8]  0.49534144  1.22205509  0.30212585
#
#$unif
# [1]  0.59694648  0.53584905  0.62548846  0.41625085 -0.33262723  0.78838499 -0.63705366
# [8]  0.06881095  0.87634516  0.22751384
#
#$pois
# [1] 0 3 0 2 1 1 1 1 1 0

使用for或者lapply迭代

可以使用for循环或者lapply对列表进行迭代,比如要绘图,则可以:

代码语言:javascript复制
for (i in test) plot(i)
lapply(test, plot)

都是将列表中的三个元素绘制出三个散点图。

使用enframe和map2迭代列表

但是其实可以有更优雅的方式迭代列表,还可以完成更多的操作,比如在每个图形上加上各自的注释信息。

先将列表转变为一种特殊的tibble:包含两列name和value,name是列表名,value是相应的值。对于test而言,value就是上面创建的三个向量,如下:

代码语言:javascript复制
test_t <- enframe(test)
tets_t
#    # A tibble: 3 x 2
#  name  value     
#  <chr> <list>    
#1 norm  <dbl [10]>
#2 unif  <dbl [10]>
#3 pois  <int [10]>

tibble可以理解为是一种高级的data.frame,基本属性是类似的。

同时对name和value两列数据进行迭代,使用map2函数:

代码语言:javascript复制
# 可以使用plot绘制
# name和value的值分别使用.x和.y引用
test_t %$% map2(name, value, ~plot(.y, main=.x))

# 也可以使用ggplot2
test_t %$% map2(name, value, function(x, y){
  df <- as_tibble(y) #转换为tibble,列名为value
  df %>% ggplot(aes(x=1:nrow(.), y=value))   geom_point()
})

三张图,其中一张图(plot绘制)如下:

如果使用ggplot2绘制,则是如下:

这里传递test_t的参数给map2时使用magrittr包的”爆炸运算符“:%$%。它的作用可和with类似,使用它后,管道后面的函数可以直接使用test_t的列名。

ggplot2后面的函数部分,x与y分别是对应name和value,最后绘图即可。

上面的图可以继续优化一下,如下:

代码语言:javascript复制
test_t %$% map2(name, value, function(x, y){
  df <- as_tibble(y) #转换为tibble,列名为value
  df %>% ggplot(aes(x=1:nrow(.), y=value))   geom_point()  
    labs(x="Index", y="Value", title = paste0(x, " distribution"))  
    theme_bw()
})

其中的一张图如下:

每个图上面都有标题,这样更容易观察。

另外,上述图还可以直接交给cowplot拼图,如:

代码语言:javascript复制
test_t %$% map2(name, value, function(x, y){
  df <- as_tibble(y) #转换为tibble,列名为value
  df %>% ggplot(aes(x=1:nrow(.), y=value))   geom_point()  
    labs(x="Index", y="Value", title = paste0(x, " distribution"))  
    theme_bw()
}) %>% cowplot::plot_grid(plotlist=., ncol=3, align="h")
ggsave("test.pdf", height = 4, width = 16)

0 人点赞