这两天在合并数据的时候发现了一个神奇的现象,rbind竟然可以合并不同列名的矩阵,而且不做任何提醒,在三个版本的R上都遇到了这个现象,看来不是个例。这样会明显造成数据错误呀!
talk is cheap, show me the code!
举例如下:
构建数据框和矩阵
建了个超级简单的数据框和矩阵。
代码语言:javascript复制name <- c('A', "B", "c")
test <- c(13, 16, 20)
df1 <- data.frame(name, test)
matrix1 <- as.matrix(df1)
name2 <- c('A', "D", "c")
test2 <- c(13, 16, 20)
df2 <- data.frame(name2, test2)
matrix2 <- as.matrix(df2)
矩阵和数据框的信息如下:
代码语言:javascript复制df1
name test
1 A 13
2 B 16
3 c 20
name test
[1,] "A" "13"
[2,] "B" "16"
[3,] "c" "20"
df2
name2 test2
1 A 13
2 D 16
3 c 20
name2 test2
[1,] "A" "13"
[2,] "D" "16"
[3,] "c" "20"
可以看出,两者的区别就是,矩阵只能放同一种类型的数据,所以全部转化成了字符串。后面我有换成全是数值试了下,结果是一样的。
rbind合并数据
合并就出现我上面描述的现象啦!
代码语言:javascript复制#数据框合并报错,没问题!
rbind(df1, df2)
Error in match.names(clabs, names(xi)) :
names do not match previous names
#矩阵和数据框合并,报错,没问题
rbind(df1, matrix2)
Error in match.names(clabs, names(xi)) :
names do not match previous names
# 矩阵合并,神奇的无警告成功运行
rbind(matrix1, matrix2)
name test
[1,] "A" "13"
[2,] "B" "16"
[3,] "c" "20"
[4,] "A" "13"
[5,] "D" "16"
[6,] "c" "20"
如何避免呢
看来以后做矩阵之间的rbind要小心了,要么保证顺序一致,要么换种方法啦!不知道有没有大神解释解释为什么呢!你怎么看这个问题,有没有被坑过呢,欢迎交流!