OSCA单细胞数据分析笔记-2—R与Bioconductor

2021-04-16 10:30:54 浏览数 (1)

分享是一种态度

对应原版教程2-3章 http://bioconductor.org/books/release/OSCA/ (对R基本了解的读者可跳过这一节)

1、简介

  • R语言是生信人最熟悉的编程语言之一,其核心在于有上万个R包极大扩充了其使用范围,需要用到那个R包,安装、加载使用即可。在生信学习过程中,有两个最常见的R包库
  • 一是Comprehensive R Archive Network(https://cran.r-project.org/mirrors.html) (CRAN),是R语言的最常用、基础的R包库,适用于全部的R语言使用者(各行各业);

CRAN

  • 二是Bioconductor(https://bioconductor.org/),为生信人建立的R包库。其主要包含了许多专门用于分析某一类生信数据的包。(当然也包含一些数据包)

Bioconductor

2、基础操作

2.1 设置镜像

提高下载安装包的速度。如下分别为bioconductorCRAN选择了清华的镜像源

代码语言:javascript复制
options()$repos 
options()$BioC_mirror
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options()$repos 
options()$BioC_mirror

2.2 安装R包

安装源自CRAN的包:install.packages()基础函数

代码语言:javascript复制
install.packages("BiocManager")

安装源自Bioconductor的包:BiocManager::install();其中BiocManager是管理下载Bioconductor包的包,::表示引用该包的函数,install()就是下载包的函数。

代码语言:javascript复制
BiocManager::install("SingleCellExperiment")

所以安装包之前的第一步就是要判断该包来自CRAN库还是Bioconductor

2.3 获取帮助文档

方式1:?函数名(后面不要加括号),前提需要加载该包才行。否则会提醒使用??进行全局搜索。

代码语言:javascript复制
library(SingleCellExperiment)
?cpm

方式2:Rstudio右下栏的packages。可先在搜索栏快速检索包的名字,然后调出选定包的全部函数帮助文档。

  • 方式3:CRAN/Bioconductor的官网里的该包出处。其中如作者所说,Bioconductor对开发包人员所提供的帮助文档有更严格的要求
  • 方式4:百度/google等等

3、R在线学习资源

上面只是简单根据教程介绍了一些R基础知识点,但例如安装R、Rstudio操作,R的数据结构等可专门另行找资料学习。结合教程,推荐的开源资源如下。

  • R for Data Science (适合初学者) https://r4ds.had.co.nz/
  • R语言教程(北大的李东风老师编写的,最大好处就是中文,适合小白) https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html
  • Advanced R(进阶) https://adv-r.hadley.nz/
  • 生信技能树R语言教程(B站视频) https://www.bilibili.com/video/BV1cs411j75B
  • 包括OSCA,R for Data Science等都是基于Rmarkdown编写的,所以顺便再推一个Rmd教程(B站视频) https://www.bilibili.com/video/BV1ib4y1X7r9?p=1

关于R的一些基础知识就简单介绍这么多了;相信来了解scRNA-seq数据分析的读者多少对R也已经比较了解了。下一节会介绍SingleCellExperiment,这个贯穿教程始终的数据结构组成。

往期回顾

单核转录组测序(snRNA-seq)鉴定多核骨骼肌纤维的转录异质性

RNA Velocity and Beyond 系列2—Model

人类胸腺发育的细胞图谱揭示了T细胞组库的形成

小鼠的13个不同组织器官的超10万个细胞才85个亚群(单细胞ATAC路在何方)




如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程

  • 数据挖掘(GEO,TCGA,单细胞)2021第2期
  • 生信爆款入门-2021第2期
  • 96核心384G内存的超级服务器(共享)使用权一年

0 人点赞