1、登录或注册用户
网址:https://www.ncbi.nlm.nih.gov/account/
2、进入SRA
网址:https://submit.ncbi.nlm.nih.gov/
向下滚动,找到Sequence Read Archive (SRA)
工具,点击Submit
2、新建提交
3、按要求填写信息
4、使用ascp
这里需要用到工具aspera,安装参考:https://blog.csdn.net/u011262253/article/details/107190684
代码语言:javascript复制ascp -i /mnt/h/work/aspera.openssh -QT -l100m -k1 -d /mnt/h/work/ncbi_upload/raw/ subasp@upload.ncbi.nlm.nih.gov:uploads/your_email_id
5、等待上传完成
6、确认是否上传完成
重复以上命令,ascp 会检测文件上传是否完整,如果上传完成,会直接 skipped
7、检测上传数据是否正确
需要理解的知识
- GenBank:一些组装好的序列,如基因组DNA,各种RNA
- Sequence Read Archive (SRA):所有的raw data只能上传到这里
- TSA:Submit computationally assembled, transcribed RNA sequences after submitting unassembled reads to SRA.
- GEO:Submit RNA-seq, ChIP-seq, and other types of gene expression and epigenomics datasets. 也就是我们常用的基因表达数据,这里可以上传处理后的数据,如count和TPM,FPKM等
- BioProject & BioSample:这是NCBI的核心组织架构,一篇文章就是一个BioProject,一个project里可以包含多个BioSample