title: "noteDay1-2"
output: html_document
date: "2023-09-07"
R Markdown
代码语言:text复制##ctrl alt i
##R markdown语法快捷键
2.1 向量生成
2.1.1 用c()逐一放到一起
代码语言:text复制c(1,2,3,4,5)
代码语言:txt复制## [1] 1 2 3 4 5
代码语言:text复制#字符串记得加引号哦
c('a','b','c','d')
代码语言:txt复制## [1] "a" "b" "c" "d"
2.1.2 连续数字用冒号':'
代码语言:text复制1:8
代码语言:txt复制## [1] 1 2 3 4 5 6 7 8
2.1.3 重复rep()、生成规律数字seq()、生成随机数rnorm()
代码语言:text复制rep('WY',times = 5) #规范写法
代码语言:txt复制## [1] "WY" "WY" "WY" "WY" "WY"
代码语言:text复制rep('WY',5) #熟练后可以简写提高效率
代码语言:txt复制## [1] "WY" "WY" "WY" "WY" "WY"
代码语言:text复制seq(from = 3,to = 15,by = 3) #规范写法
代码语言:txt复制## [1] 3 6 9 12 15
代码语言:text复制seq(3,15,3) #简写
代码语言:txt复制## [1] 3 6 9 12 15
代码语言:text复制rnorm(n=3) #规范写法
代码语言:txt复制## [1] -1.6723864 -0.6788951 0.8172239
代码语言:text复制rnorm(3) #简写
代码语言:txt复制## [1] -0.8698553 1.0545989 -0.4180826
代码语言:text复制#没记错的话,小洁老师课堂里提到过,随机数大家每次运行的结果极大概率是不相同的,但是通过一定操作可以让出现过的随机数重现(尽管大部分情况没啥必要)。
#课外拓展:现在所谓的随机数其实都是‘伪随机数’,真正的随机数可能需要量子计算机问世之后才会出现。因此通过一些特定代码,保留“随机状态”,就能使随机数重现啦。
2.1.4 通过组合之后可以生成更复杂的向量
代码语言:text复制paste0(rep('WY',times = 5),1:6) # 2.1.2 2.1.3 规范写法
代码语言:txt复制## [1] "WY1" "WY2" "WY3" "WY4" "WY5" "WY6"
代码语言:text复制paste0('WY',1:6) # 学习了循环补齐后的简写
代码语言:txt复制## [1] "WY1" "WY2" "WY3" "WY4" "WY5" "WY6"
2.2 对单个向量进行操作
2.2.1 赋值
代码语言:text复制x <- c(1,2,3,4,5) #规范的赋值符号,这辈子可能就敲两次(一次课上,一次在这)
x = c(1,2,3,4,5) #简写
(x = c(1,2,3,4,5)) #赋值加输出
代码语言:txt复制## [1] 1 2 3 4 5
代码语言:text复制x = c(1,2,3,4,5);x #多行代码写一行(不止是赋值和输出哈)
代码语言:txt复制## [1] 1 2 3 4 5
2.2.2 简单数学运算
代码语言:text复制#加减乘除、一些针对数字类型的函数都可以
x 1
代码语言:txt复制## [1] 2 3 4 5 6
代码语言:text复制log2(x)
代码语言:txt复制## [1] 0.000000 1.000000 1.584963 2.000000 2.321928
代码语言:text复制sqrt(x) #开方
代码语言:txt复制## [1] 1.000000 1.414214 1.732051 2.000000 2.236068
2.2.3 根据条件进行判断,生成逻辑值向量
#以前听一位计算机老师说过,逻辑判断是所有编程语言的核心(后面的筛选就是建立在这个基础上)
代码语言:text复制x > 3
代码语言:txt复制## [1] FALSE FALSE FALSE TRUE TRUE
代码语言:text复制x == 3
代码语言:txt复制## [1] FALSE FALSE TRUE FALSE FALSE
2.2.4 初级统计
代码语言:text复制#一些基础的函数,就算记不住百度下或者help下就行
max(x) #最大值
代码语言:txt复制## [1] 5
代码语言:text复制min(x) #最小值
代码语言:txt复制## [1] 1
代码语言:text复制mean(x) #均值
代码语言:txt复制## [1] 3
代码语言:text复制median(x) #中位数
代码语言:txt复制## [1] 3
代码语言:text复制var(x) #方差
代码语言:txt复制## [1] 2.5
代码语言:text复制sd(x) #标准差
代码语言:txt复制## [1] 1.581139
代码语言:text复制sum(x) #总和
代码语言:txt复制## [1] 15
代码语言:text复制length(x) #长度(返回数字,向量元素个数)
代码语言:txt复制## [1] 5
代码语言:text复制# 这四个函数中文上都与重复有点关联,因此放一起记忆
x = c(1,1,1,2,2,2,2,3,3,3,3,4,4,4,5)
unique(x) #去重复(以这边的x为例,返回数字,长度发生变化,这取决于你向量中非重复元素的个数)
代码语言:txt复制## [1] 1 2 3 4 5
代码语言:text复制## [1] 1 2 3 4 5
duplicated(x) #对应元素是否重复(返回逻辑值,长度不发生变化)
代码语言:txt复制## [1] FALSE TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE FALSE
## [13] TRUE TRUE FALSE
代码语言:text复制## [1] FALSE TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
## [12] FALSE TRUE TRUE FALSE
table(x) #重复值统计(每个元素的出现次数会一一对应)
代码语言:txt复制## x
## 1 2 3 4 5
## 3 4 4 3 1
代码语言:text复制## x
## 1 2 3 4 5
## 3 4 4 3 1
2.2.5 默认思想
代码语言:text复制#老师是以sort()为例子
sort(x)
代码语言:txt复制## [1] 1 1 1 2 2 2 2 3 3 3 3 4 4 4 5
代码语言:text复制sort(x,decreasing = F) # decreasing 降序,默认情况下的完整写法
代码语言:txt复制## [1] 1 1 1 2 2 2 2 3 3 3 3 4 4 4 5
代码语言:text复制sort(x,decreasing = T) # decreasing的参数可以修改成T,这样就是升序啦
代码语言:txt复制## [1] 5 4 4 4 3 3 3 3 2 2 2 2 1 1 1
##2.2.6 能用函数搞定的事情,就别自己数
代码语言:text复制# 一道课堂练习题:生成向量,内容为:"student2" "student4" "student6" "student8" "student10" "student12" "student14"
#解题思路:
#1.字符-数字的交联想到paste0() #2.观察:字符均为‘student’,使用rep(),重复次数利用函数length();数字具有一定规律,想到seq()
#顺理成章写出
a = seq(2,14,2)
paste0(rep('student',length(a)),a)
代码语言:txt复制## [1] "student2" "student4" "student6" "student8" "student10" "student12"
## [7] "student14"
#以下仅个人理解:代码不是越短越好,因为大项目都需要合作,你的代码可能会给很多人看,当然也不需要过分详细。
代码语言:text复制paste0('student',seq(2,14,2)) #最简代码(循环补齐)
代码语言:txt复制## [1] "student2" "student4" "student6" "student8" "student10" "student12"
## [7] "student14"
代码语言:text复制##paste和paste0的区别
#这边直接复制的Help文档,paste默认两个元素之间的连接存在空格(这个参数可以修改),paste0则无。
##两个向量长度不一致时,便会发生循环补齐
x = c(1,3,5,6,2)
y = c(3,2,5)
x == y
代码语言:txt复制## Warning in x == y: longer object length is not a multiple of shorter object
## length
代码语言:txt复制## [1] FALSE FALSE TRUE FALSE TRUE
代码语言:text复制#上述这种情况便会发生循环补齐,y = c(3,2,5)会变成y = c(3,2,5,3,2)
#返回与较长向量相同元素个数的逻辑值哦(这边就是5个)
#循环补齐可以在一定程度上简化代码,上文已经提到,这边就不写了
##2.3 对两个向量的操作
代码语言:text复制x = c(1,3,5,1)
y = c(3,2,5,6)
# 1.比较运算,生成等长的逻辑向量
x == y;y == x #两者等价
代码语言:txt复制## [1] FALSE FALSE TRUE FALSE
代码语言:txt复制## [1] FALSE FALSE TRUE FALSE
代码语言:text复制# 2.数学计算
x y #一一对应相加
代码语言:txt复制## [1] 4 5 10 7
代码语言:text复制# 3.连接
paste(x,y,sep=",")#由于数字之间不存在分隔符号的话容易存在混淆,因此这边一般使用paste而非paste0
代码语言:txt复制## [1] "1,3" "3,2" "5,5" "1,6"
代码语言:text复制# 4.交集、并集、差集
x = c(1,3,5,6,2)
y = c(3,2,5)
intersect(x,y)#交集
代码语言:txt复制## [1] 3 5 2
代码语言:text复制union(x,y)#并集
代码语言:txt复制## [1] 1 3 5 6 2
代码语言:text复制setdiff(x,y) # 差集,x里有,y里没有的
代码语言:txt复制## [1] 1 6
代码语言:text复制setdiff(y,x) # 差集,y里有,x里没有的
代码语言:txt复制## numeric(0)
代码语言:text复制# 5.补集(小洁老师的课堂作业)
#补集的定义:setdiff(全集,交集)
setdiff(union(x,y),intersect(x,y)) #一组合就完事啦
代码语言:txt复制## [1] 1 6
代码语言:text复制# 6.重点 %in%
x %in% y #x的每个元素在y中存在吗,返回的是逻辑值
代码语言:txt复制## [1] FALSE TRUE TRUE FALSE TRUE
代码语言:text复制y %in% x #y的每个元素在x中存在吗
代码语言:txt复制## [1] TRUE TRUE TRUE
代码语言:text复制##2.4 向量筛选(取子集)
##2.4.1 通过逻辑值
x = 8:12
x[x == 10]
代码语言:txt复制## [1] 10
代码语言:text复制x[x < 12]
代码语言:txt复制## [1] 8 9 10 11
代码语言:text复制x[x %in% c(9,13)]
代码语言:txt复制## [1] 9
##2.4.2 根据位置
代码语言:text复制x = 8:12
x[4]#要第4个
代码语言:txt复制## [1] 11
代码语言:text复制x[2:4]#要2-4个
代码语言:txt复制## [1] 9 10 11
代码语言:text复制x[c(1,5)]#要第1个和第5个
代码语言:txt复制## [1] 8 12
代码语言:text复制x[-4]#不要第4个
代码语言:txt复制## [1] 8 9 10 12
代码语言:text复制x[-(2:4)]#不要第2-4个
代码语言:txt复制## [1] 8 12
##2.4.3 xx %in% y可以帮助你从一堆信息中获取你想要的
##2.5修改向量中的某个/某些元素:取子集 赋值
代码语言:text复制x = 8:12
x[4] = 40 #改一个元素
x[c(1,5)] <- c(80,20) #改多个元素