导语
GUIDE ╲
背景介绍
假设我们现在有一个样本号“IRIS_313-11156”,想下载该样本的所有SRA数据(注意:一个样本的SRA数据可能分不同次run上机)。
目前,在NCBI中下载SRA数据主要有三种方式:
- 利用Aspera工具下载。
- 利用SRA Toolkit下载。
- 利用wget命令直接下载。
小编的个人经验:第一种Aspera工具在批量下载时偶尔会出错。第二种SRA Toolkit的prefetch命令下载,只能将数据下载到home目录下。关于前两种方法网上有很多详细的介绍,感兴趣的朋友们可以自行搜索,我们今天主要来介绍第三种wget命令的方式,这种方法的关键是找到SRA数据对应的ftp地址。
获取ftp地址
进入NCBI网页后,按如下步骤操作:
- Step1.设置NCBI的分类为:SRA
- Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次run上级,我们需要全部下载
- Step3.点击右上角的Send to
- Step4.在Choose Destination中选择File
- Step5.在Format输入栏选择RunInfo
- Step6.点击Create File,此刻会生成一个名为SraRunInfo.csv的文件,图中标黄的一列即为不同次run数据的ftp地址。
wget命令
接下来呢,用wget命令下载SRA数据,有两种方式:
下载单次run的sra数据,可以直接用命令,默认下载到当前目录下。其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载:
代码语言:javascript复制wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run-4/ERR635048/ERR635048.1
若想批量下载这个样本的四个SRA数据,可以将这四个ftp地址整合到一个文件中(如文件名为list.txt)。
利用wget函数,-i 参数给出文件的名字
代码语言:javascript复制wget -c 50 -i list.txt
小编总结
如何获取SRA的ftp地址,以及如何批量下载SRA数据你学会了吗?get了这个技能,你就可以原地休息啦!
END