部分情况下,大家可能是会从一个完全空白的服务器上面开始自己的单细胞数据分析,那么配置环境是一个蛮繁琐的事情!
首先需要安装conda
- anaconda官网:https://www.anaconda.com/products/individual
- anaconda镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
- miniconda官网:https://conda.io/miniconda.html
- miniconda镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/
每个人都可以安装自己的conda,每个用户独立操作
安装方法代码如下:
代码语言:javascript复制# 首先下载文件,20M/S的话需要几秒钟即可
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 接下来使用bash命令来运行我们下载的文件,记得是一路yes下去
bash Miniconda3-latest-Linux-x86_64.sh
# 安装成功后需要更新系统环境变量文件
source ~/.bashrc
首先保证自己的 conda 安装成功哦,然后进行下一步!
然后使用conda安装单细胞数据处理的R语言环境
很简单的几句话代码,主要是安装适合自己用户的R语言环境及相关的R包:
代码语言:javascript复制conda create -n r r-essentials r-base zlib pandoc
conda activate r
conda install -c bioconda bioconductor-singlecelltk
conda install -c bioconda bioconductor-singlecellsignalr
which R
ls -lh $HOME/miniconda3/envs/r
这个时候,你无需理会你的服务器的R语言版本或者R包啦,因为你每次都会 conda activate r 激活你自己的R语言环境哦。我们在这个环境里面安装了 bioconductor的 singlecelltk和singlecellsignalr,因为它们本身就会依赖大量的其它R语言包,所以理论上这个时候你的这个 conda activate r 小环境,已经是比较好的可以用来做单细胞转录组数据分析的啦!
两个工具的主页分别是:
- https://bioconductor.org/packages/3.14/bioc/vignettes/SingleCellSignalR/inst/doc/UsersGuide.html
- https://bioconductor.org/packages/3.14/bioc/html/singleCellTK.html
一般来说,默认会安装最新版 R 语言 :
代码语言:javascript复制 r-askpass-1.1 | r41hcfec24a_2 28 KB
r-assertthat-0.2.1 | r41hc72bb7e_2 70 KB
r-backports-1.3.0 | r41hcfec24a_0 104 KB
r-base-4.1.1 | hb93adac_1 24.8 MB
r-base64enc-0.1_3 | r41hcfec24a_1004 44 KB
r-bit-4.0.4 | r41hcfec24a_0 613 KB
r-bit64-4.0.5 | r41hcfec24a_0 506 KB
r-blob-1.2.2 | r41hc72bb7e_0 64 KB
r-boot-1.3_28 | r41hc72bb7e_0 633 KB
r-brio-1.1.2 | r41hcfec24a_0 37 KB
再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
- 《生信分析人员如何系统入门R(2019更新版)》
- 《生信分析人员如何系统入门Linux(2019更新版)》