如何在NCBI中下载SRA数据?

2022-03-29 14:48:15 浏览数 (1)

导语

GUIDE ╲

背景介绍

假设我们现在有一个样本号“IRIS_313-11156”,想下载该样本的所有SRA数据(注意:一个样本的SRA数据可能分不同次run上机)。

目前,在NCBI中下载SRA数据主要有三种方式:

  • 利用Aspera工具下载。
  • 利用SRA Toolkit下载。
  • 利用wget命令直接下载。

小编的个人经验:第一种Aspera工具在批量下载时偶尔会出错。第二种SRA Toolkit的prefetch命令下载,只能将数据下载到home目录下。关于前两种方法网上有很多详细的介绍,感兴趣的朋友们可以自行搜索,我们今天主要来介绍第三种wget命令的方式,这种方法的关键是找到SRA数据对应的ftp地址。

获取ftp地址

进入NCBI网页后,按如下步骤操作:

  • Step1.设置NCBI的分类为:SRA
  • Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次run上级,我们需要全部下载
  • Step3.点击右上角的Send to
  • Step4.在Choose Destination中选择File
  • Step5.在Format输入栏选择RunInfo
  • Step6.点击Create File,此刻会生成一个名为SraRunInfo.csv的文件,图中标黄的一列即为不同次run数据的ftp地址。

wget命令

接下来呢,用wget命令下载SRA数据,有两种方式:

下载单次run的sra数据,可以直接用命令,默认下载到当前目录下。其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载:

代码语言:javascript复制
wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run-4/ERR635048/ERR635048.1

若想批量下载这个样本的四个SRA数据,可以将这四个ftp地址整合到一个文件中(如文件名为list.txt)。

利用wget函数,-i 参数给出文件的名字

代码语言:javascript复制
wget -c 50 -i list.txt

小编总结

如何获取SRA的ftp地址,以及如何批量下载SRA数据你学会了吗?get了这个技能,你就可以原地休息啦!

END

ftp

0 人点赞