sra转fastq

2024-07-12 11:58:38 浏览数 (1)

因为恰好遇到了PRJNA752099这个数据集,他上传的fastq文件被合并成了一个,所以我需要下载SRA文件重新拆分。正好作为上游最后一块的补充内容。

下载sratoolkit

代码语言:linux复制
wget --output-document sratoolkit.tar.gz https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz
tar -vxzf sratoolkit.tar.gz
export PATH=$PATH:$PWD/sratoolkit.3.1.1-ubuntu64/bin
faster-dump --help

我事先下载了PRJNA752099的4个SRA文件,所以这里从转fastq开始。

代码语言:linux复制
mkdir fastq_store
ls SRR* > list.txt
#sh脚本
samples=$(<list.txt)
for s in ${samples};do
   echo "${s} starts at $(date)"
   fasterq-dump ./${s} -O fastq_store -e 10 --include-technical -S 
   echo "${s} finished at $(date)"
done

这里解释一下faster-dump需要设置--include-technical才能读取barcode之类的reads,而且无法输出.gz格式的压缩文件,需要自行压缩。

运行完成后可以看到每个样本输出了3个fastq文件。

分别查看这几个文件,可以看到1是索引信息,2中是barcode,3是对应R2的长读

接下来只需要压缩后软链接到cellranger脚本路径下改名然后开始定量啦。

代码语言:linux复制
nohup gzip SRR*_1.fastq SRR*_2.fastq SRR*_3.fastq &

0 人点赞