这节按生信技能树的要求进行数据下载,同时下载一组肝癌数据。 文章:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到数据地址GSE81916 这样就可以下载sra文件作业,看文章里的methods部分,把它用到的软件和参数摘抄下来,然后理解GEO/SRA数据库的数据存放形式,把规律和笔记发在论坛上面!
1.0 论坛作业数据下载
首先,按照这个方法可以去查找文章和数据。共下载7个文件,我仿写了个代码,如下: 运行起来速度还是很好,平均5M/S.
代码语言:javascript复制cd /mnt/f/rna_seq/data
for ((i=56;i<=62;i ));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR358/SRR35899${i}/SRR35899${i}.sra .;done
备注:下载总共大概6h。
1.00下载自己的数据
文章在https://sci-hub.tw/http://doi.org/10.1038/onc.2013.424 首先在https://www.ncbi.nlm.nih.gov/sra,输入liver cancer,下载个较小的肝癌数据。选定https://www.ncbi.nlm.nih.gov/sra?term=SRP007560 (这个过程我是反着来的,现在SRA找到合适的数据,然后再下载文章) 具体信息见这里和这里
需要下载的四个数据为SRR316212 -215 同样,代码为
代码语言:javascript复制for ((i=2;i<=5;i ));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR316/SRR31621${i}/SRR31621${i}.sra .;done