Aspera下载NCBI和EBI文件

2020-04-01 16:35:02 浏览数 (1)

Aspera下载和安装

Aspera下载: http://downloads.asperasoft.com/connect2/。

代码语言:javascript复制
wget http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz
tar zxf aspera-connect-3.5.1.92523-linux-64.tar.gz
sh aspera-connect-3.5.1.92523-linux-64.sh
echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc
source ~/.bashrc
ascp --help

软件一般安装在 ~/.aspera/connect/ 目录下。

Aspera使用: 使用说明:https://www.internationalgenome.org/faq/how-download-files-using-aspera

Aspera 高速下载 NCBI或 EBI 上的数据:

1.EBI 数据下载:
代码语言:javascript复制
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh 
  --host=fasp.sra.ebi.ac.uk --user=era-fasp --mode=recv 
  /vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./
#或者
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh 
  era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./
2.NCBI数据下载:
代码语言:javascript复制
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh 
  --host=ftp-private.ncbi.nlm.nih.gov --user=anonftp --mode=recv 
  /sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./
#或者
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh 
  anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./

主要参数: -v verbose mode 详细模式,显示运行记录 -T 不进行加密。若不添加此参数,可能会下载不了。 -i 免密从SRA和ENA下载的私钥,为·安装 aspera 后有在目录 ~/.aspera/connect/etc/ 下的asperaweb_id_dsa.openssh 文件。 -l 设置最大传输速度,一般200m到500m,默认似乎是10m/s的速度,比较慢 -k 断点续传,一般设置为值1 -P 用于SSH身份验证的TCP端口,一般是33001 --host=string ftp的host名,NCBI的为ftp-private.ncbi.nlm.nih.gov;EBI的为fasp.sra.ebi.ac.uk。 --user=string 用户名,NCBI的为anonftp,EBI的为era-fasp。 --mode=string 选择模式,上传为 send,下载为 recv。

欢迎关注~

参考: https://zhuanlan.zhihu.com/p/39387340 https://www.jianshu.com/p/f16ed4c79739 https://ngs-data-for-pathogen-analysis.readthedocs.io/zh_CN/latest/chapter_01/01_get_data.html https://blog.csdn.net/herokoking/article/details/76530517

0 人点赞