大家好,我是飞哥,很多时候,我们需要对Excel进行批量处理,毕竟,没有批量二字,就彰显不出程序员的气质。
比如,我们有300个Excel表格,数据格式类似,我们想对其进行读取,然后合并。
当然,合并包括,行堆积,列对接,根据ID列合并等操作。在R语言都是可以实现的。
还有一个Excel表格,有100个Sheet,想把这100个sheet表读取然后合并。
还有一种情况,是有100个Excel表格,想把其合并到一个Excel中不同的sheet。
虽然,我知道大家的电脑内存很大,但是你这样折腾Excel真的好吗???
多年的工作经验告诉我,永远不要质疑,不要质疑对你提出需求的人,比如我说:“你为什么要把100个Excel表格合并到一个Excel的不同sheet中?电脑能打开吗?你能一个sheet一个sheet的看数据吗?为什么不合并到一个sheet中,然后用数据透视表查看筛选?”然后我就要两件事都要做,还要介绍Excel表如何用筛选功能。
不管怎么说,有需求就有答案。有句歌词写得特别好:“擦干泪,不要问,为什么”。
教程来了
1. 模拟数据
模拟数据的过程很简单,新建一个Excel,里面加点内容,然后复制粘贴,重命名。
❝懂了这么多编程知识,这一步显得不够高科技,但是确实是很直接。❞
2. 批量读取
2.1 批量读取多个Excel数据
「步骤:」
- 先把目录下的Excel名称列出来
- 批量读取
- 后续操作
library(tidyverse)
library(openxlsx)
list_name = dir("./",pattern = ".xlsx")
list_name
re = map(list_name, ~ read.xlsx(.,sheet=1))
re
names(re) = list_name
re
write.xlsx(re,"../re_hebing.xlsx")
目录:
读取结果:
结果文件:
2.2 批量读取一个Excel的不同sheet表格
「步骤:」
- 共有8个sheet
- 批量读取
- 后续操作
name_sheet = 1:8
re2 = map(name_sheet, ~ read.xlsx("../re_hebing.xlsx",sheet=.))
re2
3. 批量写入
3.1 批量写入到不同的Excel中
「步骤:」
- 内容为list,每个元素为一个data.frame
这里,我们用re
的结果:
> str(re)
List of 8
$ a1.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a2.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a3.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a4.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a5.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a6.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a7.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
$ a8.xlsx:'data.frame': 4 obs. of 2 variables:
..$ ID: num [1:4] 1 2 3 4
..$ y : num [1:4] 0.6275 0.4325 0.6046 0.0681
这里,我们将工作目录设置为上一级,用map2
进行操作:
setwd("../")
sheet_name = names(re)
sheet_name
map2(re,sheet_name,write.xlsx)
结果:
3.2 批量写入到同一个Excel中不同sheet表格
这就不用操作,直接写入就行了,一行代码:
代码语言:javascript复制write.xlsx(re,"new_new_many_sheets.xlsx")
4. 知识点总结
- 使用了map和匿名函数进行批量操作 写入多个Excel时,用了map2函数,其实还可以用walk2函数,walk2就不会返回结果到终端了 默认的write.xlsx函数,支持写入list就是多个sheet表格 有时候重命名list更有用,比如写入到不同sheet表格中,名称就是不同sheet表的名称 读取不同sheet表格时,可以用1,2,3表示对应的sheet 另外,如果想把批量读取的Excel进行行合并或者列合并,可以用map_dfc或者map_dfr更简单。当然,后面也可以用map再做处理。
分割线
大家好,我是邓飞,一个持续分享的农业数据分析师