使用RNA-seq定量软件salmon运行index步骤遇到的一个问题(计算集群slurm)

2023-01-06 20:36:14 浏览数 (1)

salmon 帮助文档

https://salmon.readthedocs.io/en/latest/building.html#installation

github主页

https://github.com/COMBINE-lab/salmon

我最开始是直接使用conda安装的 v1.4

首先第一步是对参考转录组进行索引,命令

代码语言:javascript复制
salmon index -t pome.fa -i transcripts_index_1 -p 16

这一步不知道为啥总是卡住

image.png

到这里就进行不下去了

然后我在github上直接下载了编译好的v1.9

代码语言:javascript复制
./salmon/bin/salmon index -t pome.fa -i transcripts_index_2

image.png

同样的会卡到这一步

但是用v1.0指定核心数却可以运行完

试了一次能够运行,试第二次的时候又卡住了 不知道为啥

这个和salmon是哪个版本关系应该不到,而且有时候可以成功,有时候就会卡住,但是卡住的时候多

已解决

请教了课题组的师兄,应该是文件存贮的原因,我用到的是计算机集群,涉及到的文件存储知识我也搞不太明白,我的大体理解是:计算集群存储的系统是两套,当启用一个计算节点的时候,这个计算节点有一个临时的文件存储系统,节点关闭自动会删除这个临时的文件存储系统,每次节点启动这个临时的存储系统路径都不一样,可以使用命令$TMPDIR来获取存储路径 参考这个链接 https://help.cropdiversity.ac.uk/data-storage.html。计算集群还有一个单独的文件存储系统,这个系统是永久的。默认的输出文件是在计算集群的单独的数据文件存储。使用salmon这个软件需要将输出文件指定到节点的临时文件存储中,运行完再将输出结果复制到计算集群的文件存储系统中

(这个理解不知道是否正确)

我运行如下命令

代码语言:javascript复制
salmon index -t pome01.fa -i /tmp/myan_3797261/transcripts_index_05 --threads 4

就能够顺利运行,然后将结果复制到集群的存储系统中

代码语言:javascript复制
cp -R $TMPDIR/transcripts_index_05/ ./

量化的步骤使用集群的文件存储还是节点的临时存储都是可以的

0 人点赞