很多小伙伴手头有生信数据分析,但苦于没有服务器,没法完成自己需要的数据分析,特别是处于学习阶段的同学。这里,向大家推荐一下使用腾讯云CVM服务器,按量计费进行数据分析。一般认为,除了公司,普通人难以负担高性能的服务器价格。但是现在无处不在的云服务,让我们可以享受随开随用的便利,在使用时间短的情况下,可以节约成本和时间,特别是如果有些数据库的文件在国外的情况下,由于出境带宽有限,使用一台物理位置在中国香港的腾讯云服务器可以节约大量的数据下载和软件安装步署时间,更加专注于数据分析。下面我以自己的qiime2分析微生物16S数据分析经历,介绍一下相关使用经验。
1.开通云服务器
首先,估计一下自己的数据所需要的计算能力,对于我手上的16S V4测序数据,一般只需要8核心16G内存就足够了,于是我就开一个这样配置的云服务器。当然,帐户注册,实名认证这里就不表了。
打开https://buy.cloud.tencent.com/cvm?tab=lite®ionId=1&projectId=-1就看到了云服务器购买的选项,选按量计费,然后选择地区,这里我选了中国香港,如果不需要太多国际数据的下载,可以选择更具有性价比的国内区域,更佳的选择是选离自己比较近的物理区域,理论上讲这样网络延迟会更小一点。
因为流量是按量计费的,所以带宽可以拉到最大,不多花钱,还能节约时间,一举两得。
然后,新建安全组,放通需要的端口,设置一下密码,用户名是默认ubuntu的,就可以愉快的确认信息完成购买了。可以看到,价格只有2元左右1小时,还是比较实惠的。
2.搭建环境
安装conda,R, Rstudio,就可以开心地在浏览器网页上实现数据分析了。Rsudio可以方便地运行单个命令或shell脚本,是不可多得的神器。
代码语言:txt复制#下载miniconda
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
#安装
bash Miniconda3-latest-Linux-x86_64.sh
#下载qiime2配置文件
wget https://data.qiime2.org/distro/core/qiime2-2020.2-py36-linux-conda.yml
#安装
conda env create -n qiime2-2020.2 --file qiime2-2020.2-py36-linux-conda.yml
#添加几个channel
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes
#安装R
sudo apt-get install r-base -y
sudo apt-get install gdebi-core -y
#下载安装Rstudio
wget https://download2.rstudio.org/server/bionic/amd64/rstudio-server-1.2.5033-amd64.deb
sudo gdebi rstudio-server-1.2.5033-amd64.deb
#添加用户和密码,因为rstudio不能以管理员用户登陆
sudo useradd user
sudo passwd 123456
然后,把数据通sftp上传,就可以使用自己的脚本进行正常的数据分析了。
特别的,如果这个环境需要重复利用,可以将其制作为镜像或快照,下次直接使用,再次节省了时间。如果哪天腾讯云可以提供一些常用生物公共数据库的国内镜像,就像系统镜像一样,我们的数据分析会更加方便,节约时间和成本。