今天遇到了一个百思不得解的问题,记录一下,欢迎交流讨论。为了简化问题,我把数据删除到两行,并把问题最小化了。我想用apply函数筛选一下第三列V4中的数据,用一个稍微复杂的条件,这里我简化成了是否大于0,当然,如果只是>0,太多方法可以实现了,只是复现最小错误。
代码语言:javascript复制# 原始数据如下:
# pca_test
# V1 V2 V4
1 1 439947 -0.000695291
16035 2264 19307-P128 0.064951700
我最初的代码如下:
代码语言:javascript复制test_func <- function(row){
print(row[3])
row[3] > 0
}
apply(pca_test, 1, test_func)
才开始没打印出来的(此处省略n十分钟)。打印出来才发现问题所在,正数多了个空格(如蓝色空格所示),导致结果错误,但是单独放一行上去结果是OK的。就是这么神奇有没有,怎么解决呢,as.numeric转化成数值试试?
代码语言:javascript复制test_func <- function(row){
print(as.numeric(row[3]))
as.numeric(row[3]) > 0
}
apply(pca_test, 1, test_func)
问题解决啦!原因分析:
可能是因为会转化成字符串,导致空格多出来,或者是个bug。原来的数据结构如下:
数据处理过程中,需要的值变成了chr类型: