安装生物软件和配置数据库

2022-10-25 19:33:25 浏览数 (1)

背景

当系统环境配置完成之后就可以开始安装生物软件了。生物软件安装有多种方式,可以直接使用源代码编译,也可以直接下载安装编译好的版本。当前还有 bioconda 方便管理生物软件。如果以上方式都很难安装成功软件,还可以使用 docker 的方法。如果是 ubuntu 系统,还可以直接使用 apt 命令安装生物软件。

一、安装生物软件

每个用户可以自己安装软件,例如每个用户单独使用 bioconda 来管理生物软件。如果是管理员安装的软件,则所有用户都可以使用。

由于生物软件更新较快,源代码编译或者预编译的软件更新比较麻烦,这里推荐使用biocodna 来管理软件。

1.1 安装 bioconda

代码语言:javascript复制
cd /ifs1/Software
#下载安装:
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
sh Miniconda3-latest-Linux-x86_64.sh  
#默认目录/root/miniconda3 修改为/ifs1/Software/miniconda3
#by running conda init? [yes|no] 写yes回车
#刷新环境
source ~/.bashrc

#运行以下命令,添加软件源:
conda config --add channels bioconda 
conda config --add channels conda-forge

#4 安装mamba
conda install -y mamba

1.2 bioconda 安装生物软件

代码语言:javascript复制
#利用mamba安装软件
mamba install -y bwa 
mamba install -y samtools
mamba install -y bcftools
mamba install -y blast 
mamba install -y blat 
mamba install -y mummer 
mamba install -y mafft 
mamba install -y muscle 
mamba install -y lastz
mamba install -y sra-tools
mamba install -y seqkit
mamba install -y seqtk
mamba install -y bedtools
mamba install -y bedops
mamba install -y gfatools
mamba install -y circos
mamba install -y entrez-direct
mamba install -y emboss

#安装数据质控软件
mamba install -y fastqc multiqc 
mamba install -y trimmomatic
mamba install -y fastp
mamba create -n nanoplot -y nanoplot

#安装基因组拼接相关工具
mamba install -y velvet
mamba install -y flye
mamba install -y miniasm
mamba install -y canu
mamba install -y megahit
mamba install -y spades
mamba install -y quast
mamba install -y racon
mamba install -y miniasm
mamba install -y nanopolish

#安装基因功能分析软件
mamba install -y prodigal
mamba install -y glimmer
mamba install -y augustus
mamba install -y trf

1.3 切换 conda 环境

默认开通账号之后给定的管理员安装的 bioconda,用户可以使用里面大量的软件。但由于Linux 系统权限的问题,用户无法使用这个 conda 来安装软件。当自己安装 bioconda 之后,则有权限安装软件。

首先确认默认的 bioconda 的权限,是自己安装的还是管理员安装的。

如果想要进行切换,只需修改默认的.bashrc 配置文件即可。

代码语言:javascript复制
#寻找环境中 bioconda
which conda

目前系统中有2个管理员安装的 bioconda,并记录下文件路径。里面 base 是基础环境,然后下面一些为虚拟环境。

代码语言:javascript复制
(base) [root@mgt ~]# conda env list
# conda environments:
#
base                  *  /share/Software/miniconda3
test                     /share/Software/miniconda3/envs/test
                         /share/home/chenht/anaconda3
                         /share/home/lius/anaconda3
                         /share/home/lius/anaconda3/envs/EDTA
                         /share/home/lius/anaconda3/envs/MINES
                         /share/home/lius/anaconda3/envs/Rscript
                         /share/home/lius/anaconda3/envs/axel
                         /share/home/lius/anaconda3/envs/bedtools
                         /share/home/lius/anaconda3/envs/blast
                         /share/home/lius/anaconda3/envs/blat

利用 conda activate 激活环境中的 bioconda,直接使用其他环境中安装的软件。

代码语言:javascript复制
conda activate /share/Software/miniconda3/
#查看bwa路径
(/share/Software/miniconda3) xiehs 07:44:36 ~
$ which bwa
/share/Software/miniconda3/bin/bwa
#激活test环境
(/ifshares1/Software/miniconda3) xiehs 07:45:09 ~
$ conda activate /share/Software/miniconda3/envs/test
(test) xiehs 07:45:19 ~
$ which NanoPlot 
/share/Software/miniconda3/envs/test/bin/NanoPlot

1.4 配置 PATH 变量

可以将管理员安装生物软件目录配置到每个用户.bashrc 文件中的 PATH 变量中。

代码语言:javascript复制
echo "export PATH="$PATH:./:/ifs1/Software/bin/:$PATH" " >>~/.bashrc
source ~/.bashrc

这样在任何目录下都可以直接敲命令软件命令运行软件了,以后安装完软件只需要将其可执行程序链接到/ifs1/Software/bin/目录下即可。

二、管理生物数据库

由于生物数据库文件较大,最好放到统一目录下,这样所有用户都可以读取,而无需单独下载。可以像之前说的创建一个单独的 Database 文件夹,和User平级目录,将生物数据库放到该目录下。

写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。

代码语言:javascript复制
sx.voiceclouds.cn

有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。

0 人点赞