学习小组DAY5-Creep

今天学习的内容是R语言中的数据结构

向量

理解向量之前，需要知道元素的概念。元素指的是数字或字符串，根据它可以区分标量和向量

标量：一个元素组成的变量
向量：多个元素组成的变量

使用时，会用到赋值，昨天学习的<-就是赋值命令，赋值可以是数值、字符串、数据框等。以下是赋值操作的练习。

x<- c(1,2,3) #常用的向量写法，意为将x定义为由元素1，2，3组成的向量 x 1 2 3
x<- 1:10 #从1-10之间所有的整数 x 1 2 3 4 5 6 7 8 9 10
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数（注意是逗号不是分号） x 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0
x<- rep(1:3,times=2) #1-3 重复2次 x 1 2 3 1 2 3

赋值操作会对上一次赋值的内容进行覆盖，以最近一次的赋值为准。

提取向量

1.根据元素的位置进行提取

x[4] #x第4个元素 [1] 1
x[-4]#排除法，除了第4个元素之外剩余的元素 [1] 1 2 3 2 3
x[2:4]#第2到4个元素 [1] 2 3 1
x[-(2:4)]#除了第2-4个元素 [1] 1 2 3
x[c(1,5)] #第1个和第5个元素 [1] 1 2

根据元素的值进行提取x[x==2]#等于2的元素

[1] 2 2
x[x>0]#大于0的元素 [1] 1 2 3 1 2 3
x[x %in% c(1,2,5)]#存在于向量c（1，2，5）中的元素 [1] 1 2 1 2

数据框

首先将示例数据文件放到目录下，前一天操作中提到getwd setwd就能显示并更改自己所在的工作目录

读取本地数据

read.table(file = "huahua.txt",sep = "t",header =T) X1 X2 1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
a<-read.table(file = "huahua.txt",sep = "t",header =T)

设置行名和列名

a<-read.table(file = "huahua.txt",sep = "t",header =T) X<-read.csv('doudou.txt') #在示例数据里有doudou.txt 注意这里的变量X是一个数据框 colnames(X) #查看列名 1 "X1" "X2"
rownames(X) #查看行名,默认值的行名就是行号，1.2.3.4... 1 "1" "2" "3" "4" "5"
colnames(X)1<-"bioplanet"#有的公司返回数据，左上角第一格为空，R会自动补为x,用这个命令来修改 X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列为行名 X X2
A 1
B NA
C NA
D 3
E NA