NoteDay1-2_ 字节宝

title: "noteDay1-2"

output: html_document

date: "2023-09-07"

R Markdown

代码语言：text复制

##ctrl alt i 
##R markdown语法快捷键

2.1 向量生成

2.1.1 用c()逐一放到一起

代码语言：text复制

c(1,2,3,4,5)

代码语言：txt复制

## [1] 1 2 3 4 5

代码语言：text复制

#字符串记得加引号哦
c('a','b','c','d')

代码语言：txt复制

## [1] "a" "b" "c" "d"

2.1.2 连续数字用冒号':'

代码语言：text复制

1:8

代码语言：txt复制

## [1] 1 2 3 4 5 6 7 8

2.1.3 重复rep()、生成规律数字seq()、生成随机数rnorm()

代码语言：text复制

rep('WY',times = 5) #规范写法

代码语言：txt复制

## [1] "WY" "WY" "WY" "WY" "WY"

代码语言：text复制

rep('WY',5) #熟练后可以简写提高效率

代码语言：txt复制

## [1] "WY" "WY" "WY" "WY" "WY"

代码语言：text复制

seq(from = 3,to = 15,by = 3) #规范写法

代码语言：txt复制

## [1]  3  6  9 12 15

代码语言：text复制

seq(3,15,3) #简写

代码语言：txt复制

## [1]  3  6  9 12 15

代码语言：text复制

rnorm(n=3) #规范写法

代码语言：txt复制

## [1] -1.6723864 -0.6788951  0.8172239

代码语言：text复制

rnorm(3) #简写

代码语言：txt复制

## [1] -0.8698553  1.0545989 -0.4180826

代码语言：text复制

#没记错的话，小洁老师课堂里提到过，随机数大家每次运行的结果极大概率是不相同的，但是通过一定操作可以让出现过的随机数重现（尽管大部分情况没啥必要）。
#课外拓展：现在所谓的随机数其实都是‘伪随机数’，真正的随机数可能需要量子计算机问世之后才会出现。因此通过一些特定代码，保留“随机状态”，就能使随机数重现啦。

2.1.4 通过组合之后可以生成更复杂的向量

代码语言：text复制

paste0(rep('WY',times = 5),1:6) # 2.1.2   2.1.3 规范写法

代码语言：txt复制

## [1] "WY1" "WY2" "WY3" "WY4" "WY5" "WY6"

代码语言：text复制

paste0('WY',1:6) # 学习了循环补齐后的简写

代码语言：txt复制

## [1] "WY1" "WY2" "WY3" "WY4" "WY5" "WY6"

2.2 对单个向量进行操作

2.2.1 赋值

代码语言：text复制

x <- c(1,2,3,4,5) #规范的赋值符号，这辈子可能就敲两次（一次课上，一次在这）
x = c(1,2,3,4,5) #简写
(x = c(1,2,3,4,5)) #赋值加输出

代码语言：txt复制

## [1] 1 2 3 4 5

代码语言：text复制

x = c(1,2,3,4,5);x #多行代码写一行（不止是赋值和输出哈）

代码语言：txt复制

## [1] 1 2 3 4 5

2.2.2 简单数学运算

代码语言：text复制

#加减乘除、一些针对数字类型的函数都可以
x 1

代码语言：txt复制

## [1] 2 3 4 5 6

代码语言：text复制

log2(x)

代码语言：txt复制

## [1] 0.000000 1.000000 1.584963 2.000000 2.321928

代码语言：text复制

sqrt(x) #开方

代码语言：txt复制

## [1] 1.000000 1.414214 1.732051 2.000000 2.236068

2.2.3 根据条件进行判断，生成逻辑值向量

#以前听一位计算机老师说过，逻辑判断是所有编程语言的核心（后面的筛选就是建立在这个基础上）

代码语言：text复制

x > 3

代码语言：txt复制

## [1] FALSE FALSE FALSE  TRUE  TRUE

代码语言：text复制

x == 3

代码语言：txt复制

## [1] FALSE FALSE  TRUE FALSE FALSE

2.2.4 初级统计

代码语言：text复制

#一些基础的函数，就算记不住百度下或者help下就行
max(x) #最大值

代码语言：txt复制

## [1] 5

代码语言：text复制

min(x) #最小值

代码语言：txt复制

## [1] 1

代码语言：text复制

mean(x) #均值

代码语言：txt复制

## [1] 3

代码语言：text复制

median(x) #中位数

代码语言：txt复制

## [1] 3

代码语言：text复制

var(x) #方差

代码语言：txt复制

## [1] 2.5

代码语言：text复制

sd(x) #标准差

代码语言：txt复制

## [1] 1.581139

代码语言：text复制

sum(x) #总和

代码语言：txt复制

## [1] 15

代码语言：text复制

length(x) #长度（返回数字，向量元素个数）

代码语言：txt复制

## [1] 5

代码语言：text复制

# 这四个函数中文上都与重复有点关联，因此放一起记忆
x = c(1,1,1,2,2,2,2,3,3,3,3,4,4,4,5)
unique(x) #去重复（以这边的x为例，返回数字，长度发生变化，这取决于你向量中非重复元素的个数）

代码语言：txt复制

## [1] 1 2 3 4 5

代码语言：text复制

## [1] 1 2 3 4 5
duplicated(x) #对应元素是否重复（返回逻辑值，长度不发生变化）

代码语言：txt复制

##  [1] FALSE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE FALSE
## [13]  TRUE  TRUE FALSE

代码语言：text复制

##  [1] FALSE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE
## [12] FALSE  TRUE  TRUE FALSE
table(x) #重复值统计（每个元素的出现次数会一一对应）

代码语言：txt复制

## x
## 1 2 3 4 5 
## 3 4 4 3 1

代码语言：text复制

## x
## 1 2 3 4 5 
## 3 4 4 3 1

2.2.5 默认思想

代码语言：text复制

#老师是以sort()为例子
sort(x)

代码语言：txt复制

##  [1] 1 1 1 2 2 2 2 3 3 3 3 4 4 4 5

代码语言：text复制

sort(x,decreasing = F) # decreasing 降序，默认情况下的完整写法

代码语言：txt复制

##  [1] 1 1 1 2 2 2 2 3 3 3 3 4 4 4 5

代码语言：text复制

sort(x,decreasing = T) # decreasing的参数可以修改成T，这样就是升序啦

代码语言：txt复制

##  [1] 5 4 4 4 3 3 3 3 2 2 2 2 1 1 1

##2.2.6 能用函数搞定的事情，就别自己数

代码语言：text复制

# 一道课堂练习题：生成向量，内容为："student2"  "student4"  "student6"  "student8"  "student10" "student12" "student14"
#解题思路：
#1.字符-数字的交联想到paste0() #2.观察：字符均为‘student’，使用rep()，重复次数利用函数length();数字具有一定规律，想到seq()
#顺理成章写出
a = seq(2,14,2)
paste0(rep('student',length(a)),a)

代码语言：txt复制

## [1] "student2"  "student4"  "student6"  "student8"  "student10" "student12"
## [7] "student14"

#以下仅个人理解：代码不是越短越好，因为大项目都需要合作，你的代码可能会给很多人看，当然也不需要过分详细。

代码语言：text复制

paste0('student',seq(2,14,2)) #最简代码（循环补齐）

代码语言：txt复制

## [1] "student2"  "student4"  "student6"  "student8"  "student10" "student12"
## [7] "student14"

代码语言：text复制

##paste和paste0的区别
#这边直接复制的Help文档，paste默认两个元素之间的连接存在空格（这个参数可以修改），paste0则无。

##两个向量长度不一致时，便会发生循环补齐
x = c(1,3,5,6,2)
y = c(3,2,5)
x == y

代码语言：txt复制

## Warning in x == y: longer object length is not a multiple of shorter object
## length

代码语言：txt复制

## [1] FALSE FALSE  TRUE FALSE  TRUE

代码语言：text复制

#上述这种情况便会发生循环补齐，y = c(3,2,5)会变成y = c(3,2,5,3,2)
#返回与较长向量相同元素个数的逻辑值哦（这边就是5个）
#循环补齐可以在一定程度上简化代码，上文已经提到，这边就不写了

##2.3 对两个向量的操作

代码语言：text复制

x = c(1,3,5,1)
y = c(3,2,5,6)

# 1.比较运算，生成等长的逻辑向量
x == y;y == x #两者等价

代码语言：txt复制

## [1] FALSE FALSE  TRUE FALSE

代码语言：txt复制

## [1] FALSE FALSE  TRUE FALSE

代码语言：text复制

# 2.数学计算
x   y #一一对应相加

代码语言：txt复制

## [1]  4  5 10  7

代码语言：text复制

# 3.连接
paste(x,y,sep=",")#由于数字之间不存在分隔符号的话容易存在混淆，因此这边一般使用paste而非paste0

代码语言：txt复制

## [1] "1,3" "3,2" "5,5" "1,6"

代码语言：text复制

# 4.交集、并集、差集
x = c(1,3,5,6,2)
y = c(3,2,5)
intersect(x,y)#交集

代码语言：txt复制

## [1] 3 5 2

代码语言：text复制

union(x,y)#并集

代码语言：txt复制

## [1] 1 3 5 6 2

代码语言：text复制

setdiff(x,y) # 差集，x里有，y里没有的

代码语言：txt复制

## [1] 1 6

代码语言：text复制

setdiff(y,x) # 差集，y里有，x里没有的

代码语言：txt复制

## numeric(0)

代码语言：text复制

# 5.补集（小洁老师的课堂作业）
#补集的定义：setdiff(全集,交集)
setdiff(union(x,y),intersect(x,y)) #一组合就完事啦

代码语言：txt复制

## [1] 1 6

代码语言：text复制

# 6.重点 %in%
x %in% y #x的每个元素在y中存在吗，返回的是逻辑值

代码语言：txt复制

## [1] FALSE  TRUE  TRUE FALSE  TRUE

代码语言：text复制

y %in% x #y的每个元素在x中存在吗

代码语言：txt复制

## [1] TRUE TRUE TRUE

代码语言：text复制

##2.4 向量筛选（取子集）
##2.4.1 通过逻辑值
x = 8:12
x[x == 10]

代码语言：txt复制

## [1] 10

代码语言：text复制

x[x < 12]

代码语言：txt复制

## [1]  8  9 10 11

代码语言：text复制

x[x %in% c(9,13)]

代码语言：txt复制

## [1] 9

##2.4.2 根据位置

代码语言：text复制

x = 8:12
x[4]#要第4个

代码语言：txt复制

## [1] 11

代码语言：text复制

x[2:4]#要2-4个

代码语言：txt复制

## [1]  9 10 11

代码语言：text复制

x[c(1,5)]#要第1个和第5个

代码语言：txt复制

## [1]  8 12

代码语言：text复制

x[-4]#不要第4个

代码语言：txt复制

## [1]  8  9 10 12

代码语言：text复制

x[-(2:4)]#不要第2-4个

代码语言：txt复制

## [1]  8 12

##2.4.3 xx %in% y可以帮助你从一堆信息中获取你想要的

##2.5修改向量中的某个/某些元素：取子集赋值

代码语言：text复制

x = 8:12
x[4] = 40 #改一个元素
x[c(1,5)] <- c(80,20) #改多个元素

学习笔记

0 人点赞