利用gganimate可视化全球范围R-Ladies(R社区性别多样性组织)发展情况

2019-10-14 16:27:43 浏览数 (1)

作者:严涛 浙江大学作物遗传育种在读研究生(生物信息学方向)伪码农,R语言爱好者,爱开源。生信宝典对代码进行了系统测试和解释。

简介

R-Ladies是一个世界性的促进R语言社区性别多样性的组织,本文分析了这个组织的粉丝成员分布信息。

这篇文章主要基于d4tagirl,稍微有所修改。原文链接:https://d4tagirl.com/2017/05/how-to-plot-animated-maps-with-gganimate

小编是用3.5.1版本的R重现以下过程的,gganimate包不能通过Tools——Install Pakages来安装,而需要从github直接安装,下面的命令适用于我所遇到的问题。(gganimate有两个包,本文用到的是老的版本。2018美日科学家因免疫治疗得诺贝尔生理医学奖|动图展示历年生理学奖中用到的是新版本,用法不太一致,还请注意。)

代码语言:javascript复制
devtools::install_github("dgrtwo/gganimate", ref = "v0.1.1”)

另外一个依赖的软件是imageMagick软件,这是一个需要单独下载并安装在PC或服务器端的图形编辑软件,下载地址:https://imagemagick.org/script/index.php,选择适合自己电脑系统的一个版本进行安装。推荐ImageMagick-6.9.10版本,最新版存在与此R包的兼容性问题。gganimate的新版本不依赖于该软件。

注意:安装路径不要有中文和空格。

数据加载

代码语言:javascript复制
# 加载包,若缺失则安装。
library(pacman)
p_load(tidyverse, gganimate, maps, ggthemes)
rladies <- read_csv(url("https://raw.githubusercontent.com/d4tagirl/R-Ladies-growth-maps/master/rladies.csv"))%>%
 select(-1)
head(rladies)## # A tibble: 6 x 7
##   screen_name     location     created_at followers age_days     lon   lat
##   <chr>           <chr>        <date>         <int>    <dbl>   <dbl> <dbl>
## 1 RLadiesSF       San Francis~ 2012-10-15       916     1673 -122     37.8
## 2 RLadiesNYC      New York     2016-09-01       309      256 - 74.0   40.7
## 3 RLadiesIstanbul <U 0130>stanbul, T~ 2016-09-06       436      251   29.0   41.0
## 4 RLadiesBCN      Barcelona, ~ 2016-10-11       377      216    2.17  41.4
## 5 RLadiesColumbus Columbus, OH 2016-10-04       179      223 - 83.0   40.0
## 6 RLadiesBoston   Boston, MA   2016-09-06       259      251 - 71.1   42.4

可视化

主要是根据地理位置信息映射到地图上

代码语言:javascript复制
# borders是map包中的函数,作用是获取地图信息和绘制地图
# 其它部分都是ggplot2的操作了
ggplot() 
 borders("world", color="gray85", fill="grey80") 
 geom_point(data = rladies, aes(lon, lat, size=followers), color="purple", alpha=0.5) 
 scale_size_continuous(range = c(8, 24), breaks = c(250, 500, 750, 1000)) 
 labs(size="Followers", title="                                             The development of R-Ladies’ Twitter accounts",x=NULL,y=NULL) 
 theme(text = element_text(family = "Times New Roman", color = "#EEEEEE"), #这部分主题修改,自己尝试,应该有更简单的办法
       plot.title = element_text(size=40,color = "#f9ba00"),
       plot.subtitle = element_text(size=14),
       axis.ticks = element_blank(),
       axis.text = element_blank(),
       panel.grid = element_blank(),
       panel.background = element_rect(fill="#333333"),
       plot.background = element_rect(fill = "#333333"),
       legend.position = c(0.18,0.36),
       legend.background = element_blank(),
       legend.key = element_blank(),
       legend.text = element_text(size = 28),
       legend.title = element_text(size=28, color = "#f9ba00")) 
 annotate(geom = "text",
          label="Made by Logos ytlogos.github.ionOriginally from d4tagirl https://d4tagirl.com",
          x=70, y=-55, size=10, family="Helvetica Black", color="#f9ba00", hjust="left")

动画展示

为了利用gganimate进行动态展示,需要构建一个映射变量:时间 (后面中的frame)。同时为了使得可视化开始呈现的是空白,结尾能继续保留展示一段时间,又构建了两个空白图层,就是下面2个数据表。

这里用的日期做的时间轴,其它数值变量或因子变量也都可以,注意根据需要修改。如果不是日期变量,不需要as.Date函数转换。

代码语言:javascript复制
# 注意起始时间一定要早于、晚于真实数据中的时间。
# 每个时间生成一张图片,若有重名,会出现图片丢失,拼合出错。
ghost_points_ini <- tibble(created_at=as.Date("2011-09-01"), followers=0, lon=0, lat=0)
ghost_points_fin <- tibble(created_at=seq(as.Date("2017-05-16"), as.Date("2017-05-30"),by="days"), followers=0, lon=0,lat=0)

添加frame映射, aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好。gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片; cumulative表示累加,新的时间轴包含之前的数据。

注意下面3个geom_point用到的数据表不同。

代码语言:javascript复制
map <- ggplot() 
 borders("world", color="gray85", fill="grey80") 
  # aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好
  # gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;
  #  cumulative表示累加,新的时间轴包含之前的数据
 geom_point(data = rladies, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), color="purple", alpha=0.5) 
 scale_size_continuous(range = c(4, 16), breaks = c(250, 500, 750, 1000)) 
 # aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好
  # gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;
  #  cumulative表示累加,新的时间轴包含之前的数据
  geom_point(data = ghost_points_ini, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), alpha=0) 
 geom_point(data = ghost_points_fin, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), alpha=0) 
 labs(size="Followers", title="The development of R-Ladies’ Twitter accounts",x=NULL,y=NULL) 
 theme(text = element_text(family = "Times New Roman", color = "#EEEEEE"),
       plot.title = element_text(size=28, color = "#f9ba00"),
       plot.subtitle = element_text(size=14),
       axis.ticks = element_blank(),
       axis.text = element_blank(),
       panel.grid = element_blank(),
       panel.background = element_rect(fill="#333333"),
       plot.background = element_rect(fill = "#333333"),
       legend.position = c(0.18,0.36),
       legend.background = element_blank(),
       legend.key = element_blank(),
       legend.text = element_text(size = 18),
       legend.title = element_text(size=24, color = "#f9ba00")) 
 annotate(geom = "text",
          label="Made by Logos ytlogos.github.ionOriginally from d4tagirl https://d4tagirl.com",
          x=70, y=-55, size=6, family="Helvetica Black", color="#f9ba00", hjust="left")
animation::ani.options(interval=0.15, ani.width=1500, ani.height=800, units="in")
gganimate::gganimate(map, filename = "d4tagirlmap.gif")

SessionInfo

代码语言:javascript复制
sessionInfo()## R version 3.4.3 (2017-11-30)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 16299)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Chinese (Simplified)_China.936
## [2] LC_CTYPE=Chinese (Simplified)_China.936  
## [3] LC_MONETARY=Chinese (Simplified)_China.936
## [4] LC_NUMERIC=C                              
## [5] LC_TIME=Chinese (Simplified)_China.936    
##
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base    
##
## other attached packages:
##  [1] ggthemes_3.4.0       maps_3.2.0           BiocInstaller_1.28.0
##  [4] forcats_0.2.0        stringr_1.2.0        dplyr_0.7.4        
##  [7] purrr_0.2.4          readr_1.1.1          tidyr_0.8.0        
## [10] tibble_1.4.2         ggplot2_2.2.1.9000   tidyverse_1.2.1    
## [13] pacman_0.4.6        
##
## loaded via a namespace (and not attached):
##  [1] reshape2_1.4.3    haven_1.1.1       lattice_0.20-35  
##  [4] colorspace_1.3-2  htmltools_0.3.6   yaml_2.1.16      
##  [7] utf8_1.1.3        rlang_0.1.6       pillar_1.1.0    
## [10] foreign_0.8-69    glue_1.2.0        modelr_0.1.1    
## [13] readxl_1.0.0      bindrcpp_0.2      bindr_0.1        
## [16] plyr_1.8.4        munsell_0.4.3     gtable_0.2.0    
## [19] cellranger_1.1.0  rvest_0.3.2       psych_1.7.8      
## [22] evaluate_0.10.1   labeling_0.3      knitr_1.19      
## [25] parallel_3.4.3    broom_0.4.3       Rcpp_0.12.15    
## [28] scales_0.5.0.9000 backports_1.1.2   jsonlite_1.5    
## [31] mnormt_1.5-5      hms_0.4.1         digest_0.6.15    
## [34] stringi_1.1.6     grid_3.4.3        rprojroot_1.3-2  
## [37] cli_1.0.0         tools_3.4.3       magrittr_1.5    
## [40] lazyeval_0.2.1    crayon_1.3.4      pkgconfig_2.0.1  
## [43] xml2_1.2.0        lubridate_1.7.1   assertthat_0.2.0
## [46] rmarkdown_1.8     httr_1.3.1        rstudioapi_0.7  
## [49] R6_2.2.2          nlme_3.1-131      compiler_3.4.3

0 人点赞