正文
本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数:
Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。 Transmutate():计算新列但删除现有变量。 同时还有mutate()和transmutate()的三个变体来一次修改多个列: Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。 Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列 Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列
- mutate:通过保留现有变量来添加新变量,通过保留现有列来添加新列(sepal_by_petal):
library(tidyverse)
my_data <- as_tibble(iris)
my_data
my_data %>%
mutate(sepal_by_petal_l = Sepal.Length/Petal.Length)
- transmute:通过删除现有变量来创建新变量,删除现有列,添加新列(sepal_by_petal):
my_data %>%
transmute(
sepal_by_petal_l = Sepal.Length/Petal.Length,
sepal_by_petal_w = Sepal.Width/Petal.Width
)
- 一次修改多个列
函数mutate_all()/ transmutate_all(),mutate_at()/ transmutate_at()和mutate_if()/ transmutate_if()可用于一次修改多个列。
简化格式如下:
代码语言:javascript复制# Mutate variants
mutate_all(.tbl, .funs, ...)
mutate_if(.tbl, .predicate, .funs, ...)
mutate_at(.tbl, .vars, .funs, ...)
# Transmutate variants
transmute_all(.tbl, .funs, ...)
transmute_if(.tbl, .predicate, .funs, ...)
transmute_at(.tbl, .vars, .funs, ...)
tbl:一个tbl数据框 funs:由funs()生成的函数调用列表,或函数名称的字符向量,或简称为函数。predicate:要应用于列或逻辑向量的谓词函数。 选择predicate为或返回TRUE的变量。
- 转换特定列
代码语言:javascript复制mutate_at():转换按名称选择的特定列:
my_data2 %>%
mutate_at(
c("Sepal.Length", "Petal.Width"),
funs(cm = ./2.54)
)
- mutate_if():转换由谓词函数选择的特定列。
- mutate_if()对于将变量从一种类型转换为另一种类型特别有用。
# 将所有因子列转化成字符
my_data %>% mutate_if(is.factor, as.character)
# 将左右数字列四舍五入
my_data %>% mutate_if(is.numeric, round, digits = 0)