rbind的坑?

2020-09-08 15:32:49 浏览数 (1)

这两天在合并数据的时候发现了一个神奇的现象,rbind竟然可以合并不同列名的矩阵,而且不做任何提醒,在三个版本的R上都遇到了这个现象,看来不是个例。这样会明显造成数据错误呀!

talk is cheap, show me the code!

举例如下:

构建数据框和矩阵

建了个超级简单的数据框和矩阵。

代码语言:javascript复制
name <- c('A', "B", "c")
test <- c(13, 16, 20)

df1 <- data.frame(name, test)
matrix1 <- as.matrix(df1)
name2 <- c('A', "D", "c")
test2 <- c(13, 16, 20)

df2 <- data.frame(name2, test2)
matrix2 <- as.matrix(df2)

矩阵和数据框的信息如下:

代码语言:javascript复制
df1
  name test
1    A   13
2    B   16
3    c   20
     name test
[1,] "A"  "13"
[2,] "B"  "16"
[3,] "c"  "20"
df2
  name2 test2
1     A    13
2     D    16
3     c    20
     name2 test2
[1,] "A"   "13" 
[2,] "D"   "16" 
[3,] "c"   "20"

可以看出,两者的区别就是,矩阵只能放同一种类型的数据,所以全部转化成了字符串。后面我有换成全是数值试了下,结果是一样的。

rbind合并数据

合并就出现我上面描述的现象啦!

代码语言:javascript复制
#数据框合并报错,没问题!
rbind(df1, df2)
Error in match.names(clabs, names(xi)) : 
  names do not match previous names
#矩阵和数据框合并,报错,没问题
 rbind(df1, matrix2)
Error in match.names(clabs, names(xi)) : 
  names do not match previous names
# 矩阵合并,神奇的无警告成功运行
rbind(matrix1, matrix2)
     name test
[1,] "A"  "13"
[2,] "B"  "16"
[3,] "c"  "20"
[4,] "A"  "13"
[5,] "D"  "16"
[6,] "c"  "20"

如何避免呢

看来以后做矩阵之间的rbind要小心了,要么保证顺序一致,要么换种方法啦!不知道有没有大神解释解释为什么呢!你怎么看这个问题,有没有被坑过呢,欢迎交流!

0 人点赞