在任何编程语言的学习中,数据的索引都是最基本且重要的技能,它是我们熟练进行数据管理和统计分析的基础,今天我将和大家简单介绍一下R中的数据索引方式。这里我主要以向量和数据框的索引方式为例进行演示,其它数据类型的索引方式和它们是一致,所以就不赘述了。
代码语言:javascript复制# 创建新的变量和数据集
x1 <- c(1,2,3,4,5) # 向量x1
x2 <- c(1,4,9,16,25) # 向量x2
age <- c(16,25,39,28,52) # 向量age
sex <- c(0,1,1,0,1) # 向量sex
mydata <- data.frame(x1,x2,age,sex) # 用向量构建新的数据框
# 对向量进行索引
x1[1] # 获取向量x1的第1个数
## [1] 1
x1[2] # 获取向量x1的第2个数
## [1] 2
x1[length(x1)] # 获取向量x1的最后1个数
## [1] 5
x1[length(x1)-1] # 获取向量x1的倒数第2个数
## [1] 4
# 对数据框进行索引
dim(mydata) # 查看数据框的行数(第1个值)和列数(第2个值)
## [1] 5 4
mydata[1,] # 获取mydata的第1行数据(返回的是1组数)
## x1 x2 age sex
## 1 1 1 16 0
mydata[,1] # 获取mydata的第1列数据(返回的是1组数)
## [1] 1 2 3 4 5
mydata[1,1] # 获取mydata的第1行中的第1列的数(返回的是1个数)
## [1] 1
mydata[c(1,3),] # 获取mydata的第1行和第2行数据
## x1 x2 age sex
## 1 1 1 16 0
## 3 3 9 39 1
mydata[,c(1,3)] # 获取mydata的第1列和第2列数据
## x1 age
## 1 1 16
## 2 2 25
## 3 3 39
## 4 4 28
## 5 5 52
mydata[dim(mydata)[1],] # 获取mydata的最后一行数据
## x1 x2 age sex
## 5 5 25 52 1
mydata[,dim(mydata)[2]] # 获取mydata的最后一列数据
## [1] 0 1 1 0 1
# 使用$符号来提取变量
mydata$x1 # 提取mydata中变量名为x1的列
## [1] 1 2 3 4 5
这里一定要记住,我们使用[]来对数据进行索引,向量的索引只需在[]里填上数据所在的位置,用一个数字表示,而对于数据框则需要用两个数字表示,第一个表示行的位置,第二个表示列的位置,两者之间用逗号进行分隔。
通过上述代码,我想大家应该已经基本掌握R中的数据索引方式了,想要熟练掌握还得靠后面的勤加练习。