最近在分析数据的时候,发现R语言中存在很多的数据类型,并且这些数据类型不同其应用与意义也不相同,下面我们列举最用的一些数据类型及在R中的函数:
我着重介绍几个数据类型:
1. as.factor 数据因子。它的主要作用是可以对数据做一个水平的注释,并且我们利用read.csv()读入的数据一般会用这个格式读入。下面我们举一个实例:
创建一个测试集,然后将数据读入R语言中,查看我们基因那一列数据类型,并且查看数据的结构,我们发现因子形式数据类型对我们一个因子出现的所有名称做了一个唯一性的水平列举。
如果我们将数据转化成因子,还可对其内的所有元素取唯一性然后进行排序。
2. data.frame 和 matrix的区别:
frame 每一列的数据要相同, 比如第一列是数值型,第二列是字符型。
matrix所有列得是同一类型,比如每一列都是数值型,或每一列都是字符型,不能第一列是数值型,第二列是字符型。
3. NULL/NA/NaN/Inf特殊数据的判断函数:
is.null(x)判断 NULL
is.na(x)判断NA
is.nan(x)判断NaN
is.infinite(x)判断Inf
欢迎各位学习交流