安装SRA tools
Linux环境下按照以下步骤怎样获得一个自己的服务器请看以下教程“站长,没钱买高配置电脑咋做转录组分析?” 下载SRA toolswget "ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz"解压tar -xzf sratoolkit.current-centos_linux64.tar.gz添加环境变量export PATH=$PATH:~/downloads/sratoolkit.2.8.2-1-centos_linux64/bin运行fastq-dump --split-3 -I SRR1001000.sra --gzip上面那个命令是转成双端测序fastq
按照STAR
安装
如果你按照下面的教程已经获得了一台云服务器,那么按照如下操作进行。10元转录组分析:这次真的是干货了~灰常干 cd ~/binhttps://github.com/alexdobin/STAR/archive/2.5.3a.tar.gztar -xzf 2.5.3a.tar.gzcd STAR-2.5.3aln -s ~/bin/STAR-2.5.3a/bin/Linux_x86_64/STAR ~/bin/STAR
建立Index
按照上面的方法,就可以在云服务器中使用STAR了此时你需要建立好indexindex是干嘛的?记住这个是你mapping前很重要的东西一定要建立好,不然后面都白弄。其他的自行百度google。index建立前你需要下载两个文件:GTF和基因组fa文件GTF下载地址在 ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_human/release_27/gencode.v27.chr_patch_hapl_scaff.annotation.gtf.gz 基因组fa文件用下面网站方法获得hg38.faftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_27/GRCh38.p12.genome.fa.gz 先下载到自己电脑上,再用FileZilla上传到服务器或者用服务器下载,下载命令是wget 后面加上下载网址 在传到自己电脑上。以后留着R语言注释用 这个时候把云服务器的配置调高,内存32G以上就行。 cd到你想要保存的位置,建立index,下面是命令 nohup STAR --runMode genomeGenerate --runThreadN 24 --genomeDir hg38_star_v27c_index --genomeFastaFiles hg38.fa --sjdbGTFfile hg38_v27.gtf & runThreadN 后面的数字填云服务器cpu核数x2genomeDir 自己命名nohup····&命令挂起用的上面那个命令,是所有文件都在一个文件中的命令如果不在一个文件,在文件前面加上相应前缀。
Mapping
准备好你的fastq文件,虽然STAR有直接解压gz文件的选项,但是不建议,最好解压好你的fastq以后在运行,这样意外会少一些。以双端测序为例,你应该有两个文件A_1.fq A_2.fq,然后Mapping 下面是命令 nohup STAR --genomeDir hg38_star_v27c_index --runThreadN 24 --readFilesIn /root/files/A_1.fq /root/files/A_2.clean.fq --outFileNamePrefix ~/files//Results/A --outSAMtype BAM Unsorted SortedByCoordinate --quantMode GeneCounts & 然后,静静等待~~~大概15~20分钟以后得到的AReadsPerGene.out.tab文件下载到自己电脑上。用文本编辑器打开看看,这就是原始文件。用自己电脑上的R进行后续分析就好了这个时候一定要注意云服务器配置调最低档,这样省钱如果不需要了,你可以制备好镜像,销毁现有的,下次在恢复。
共享生信镜像beta版
“计算机菜鸟怎么才能更easy的get到公众号教程中的技能?”曾经我也有这样的疑问,“是否有这样的工具,只上传自己的数据,简单操作就能够做生信分析。”共享生信镜像beta版就可以做到上传自己数据,或者下载SRA数据,之后进行转录组分析。关注公众号的朋友们可能已经看过下面的教程从零到壹:从SRA下载到分析~纯干货 从零到壹:10元~Mapping神器STAR的安装及用 生信干货~SRA转fastq的教程~补课啦~ 共享生信镜像beta版包含教程中所需要的工具,也就是下面这些:STAR(实现mapping Counts输出)hg38_v27 index(最新的Gencode注释)Aspera Connect(SRA高速下载工具)SRA Tools (SRA解压工具集)加入Chris生信初级教程赠送这个镜像哦