单细胞学习小组第一天

2024-06-17 20:57:01 浏览数 (2)

今天是第一天学习,这个内容并不陌生,一共花了半个小时读了花花的课程,不过摸索这个APP的使用花了一点时间,包括注册和编辑文字,第一次接触这个新事物哈。。。

笔记我就摘抄花花的课程吧,温故而知新,也get了一些装包的小技巧,也算小有收获。

1 批量安装包,代码如下:

代码语言:R复制
#首先是设置镜像

options("repos"="https://mirrors.ustc.edu.cn/CRAN/")

if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)

options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")

#来自cran的包放在一个向量里

cran_packages <- c('tidyverse',

'msigdbr',

'patchwork',

'SeuratObject',

'Seurat'

                   ) 

#来自bioconductor的包放在一个向量里

Biocductor_packages <- c('sva',

'monocle',

'GOplot',

'GSVA',

'plotmo',

'regplot',

'scRNAseq',

'BiocStyle',

'celldex',

'SingleR',

'BiocParallel'

)

#用for循环批量安装来自cran的包

for (pkg in cran_packages){

if (! require(pkg,character.only=T,quietly = T) ) {

    install.packages(pkg,ask = F,update = F)

require(pkg,character.only=T) 

  }

}

#用for循环批量安装来自bioconductor的包

for (pkg in Biocductor_packages){

if (! require(pkg,character.only=T,quietly = T) ) {

    BiocManager::install(pkg,ask = F,update = F)

require(pkg,character.only=T) 

  }

}

#再次加载所有包,检查有没有没安装好的

for (pkg in c(Biocductor_packages,cran_packages)){

require(pkg,character.only=T) 

}

#查看Seurat的版本

packageVersion("Seurat")

2.之前没学过的代码的讲解(这里一些小知识点蛮有用的)

(1) require 和library

require和library都是加载R包的意思。常规情况下需要使用R包了,用哪个都一样,加不加引号也都可以。require和library的区别主要体现在两个地方:第一是require 不报错,不会报错,顶多报warning,没道理可讲,就是这个函数脾气好;第二是require在需要的时候可以提供逻辑值:能加载成功的包(装了的),就会返回TRUE,不能加载成功的包(没装的),就会返回FALSE,虽然直接运行时看不见逻辑值,但我们有办法让它显形。

(2)if语句

条件语句,可以根据逻辑值来决定是否执行代码

(3) 装包时的分情况讨论

这个是require与if语句的结合

代码语言:R复制
if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)

这句代码会实现:

如果你电脑上已经有了BiocManager这个包,就不会执行安装;

如果你电脑上没有BiocManager这个包,就会执行安装。

(4)循环时必须要加的参数ask,updat,character.only

ask = F,update = F必须要加是因为装包经常被问是否更新,如果一个包被问了,后面的代码就会被当作对“是否更新”这个问题的回答,那循环里的其他包就执行不下去了。

character.only=T是为了消除歧义,不要把pkg这三个字母识别为一个包名,因为他是变量名,每次执行代码时会换不同的包名。

其实不是每个写在代码里的参数都要了解意思的,每个函数都有很多参数.

3 单细胞的应用方向

4 查找自己需要的单细胞数据

(1)常用的公共数据库

可以都翻一翻看,最常用的还是GEO

Gene Expression Omnibus (GEO): GEO是一个公共数据库,收集了来自全球研究机构的大量基因表达数据,其中包括很多单细胞测序数据。

Single Cell Portal: Single Cell Portal是Broad Institute开发的在线平台,提供了丰富的单细胞测序数据资源和分析工具。https://singlecell.broadinstitute.org/single_cell

Human Cell Atlas: 人类细胞图谱计划(Human Cell Atlas)是一个国际合作项目,旨在建立人类所有细胞类型的细胞图谱。他们提供了大量的单细胞 RNA 测序数据。

https://www.humancellatlas.org/

Single Cell Expression Atlas: Single Cell Expression Atlas 是由欧洲生物信息研究所(EMBL-EBI)开发的在线数据库。

https://www.ebi.ac.uk/gxa/sc/home

UCSC Cell Browser: UCSC Cell Browser 是加州大学圣克鲁兹分校(UCSC)开发的在线平台,用于浏览和分析单细胞RNA测序数据。

https://cells.ucsc.edu/

以上是第一天的学习内容。

0 人点赞