NCBI 上传测序数据

2021-04-16 11:45:28 浏览数 (1)

1、登录或注册用户

网址:https://www.ncbi.nlm.nih.gov/account/

2、进入SRA

网址:https://submit.ncbi.nlm.nih.gov/

向下滚动,找到Sequence Read Archive (SRA)工具,点击Submit

2、新建提交
3、按要求填写信息
4、使用ascp

这里需要用到工具aspera,安装参考:https://blog.csdn.net/u011262253/article/details/107190684

代码语言:javascript复制
ascp -i /mnt/h/work/aspera.openssh -QT -l100m -k1 -d /mnt/h/work/ncbi_upload/raw/ subasp@upload.ncbi.nlm.nih.gov:uploads/your_email_id
5、等待上传完成
6、确认是否上传完成

重复以上命令,ascp 会检测文件上传是否完整,如果上传完成,会直接 skipped

7、检测上传数据是否正确
需要理解的知识
  • GenBank:一些组装好的序列,如基因组DNA,各种RNA
  • Sequence Read Archive (SRA):所有的raw data只能上传到这里
  • TSA:Submit computationally assembled, transcribed RNA sequences after submitting unassembled reads to SRA.
  • GEO:Submit RNA-seq, ChIP-seq, and other types of gene expression and epigenomics datasets. 也就是我们常用的基因表达数据,这里可以上传处理后的数据,如count和TPM,FPKM等
  • BioProject & BioSample:这是NCBI的核心组织架构,一篇文章就是一个BioProject,一个project里可以包含多个BioSample

0 人点赞