10X Genomics为Cell Ranger提供了可以直接使用的人和小鼠基因组。此外,研究人员可以为其他物种创建自定义参考基因组,或向参考添加感兴趣的自定义标记基因,例如GFP。以下教程概述了使用cellranger mkref构建自定义参考基因组步骤。
- 准备输入文件,以小鼠为例: 输入文件为gtf与fasta文件: 1.下载小鼠fasta文件与gtf文件
#fasta
wget ftp://ftp.ensembl.org/pub/release-93/fasta/mus_musculus/dna/Mus_musculus.GRCm38.dna.primary_assembly.fa.gz
gunzip Mus_musculus.GRCm38.dna.primary_assembly.fa.gz
#gtf
wget ftp://ftp.ensembl.org/pub/release-93/gtf/mus_musculus/Mus_musculus.GRCm38.93.gtf.gz
gunzip Mus_musculus.GRCm38.93.gtf.gz
- 制作自己需要的GTF文件
cellranger mkgtf Mus_musculus.GRCm38.93.gtf Mus_musculus.GRCm38.93.filtered.gtf
--attribute=gene_biotype:protein_coding
--attribute=gene_biotype:lincRNA
--attribute=gene_biotype:antisense
--attribute=gene_biotype:miRNA
--attribute=gene_biotype:IG_LV_gene
--attribute=gene_biotype:IG_V_gene
--attribute=gene_biotype:IG_V_pseudogene
--attribute=gene_biotype:IG_D_gene
--attribute=gene_biotype:IG_J_gene
--attribute=gene_biotype:IG_J_pseudogene
--attribute=gene_biotype:IG_C_gene
--attribute=gene_biotype:IG_C_pseudogene
--attribute=gene_biotype:TR_V_gene
--attribute=gene_biotype:TR_V_pseudogene
--attribute=gene_biotype:TR_D_gene
--attribute=gene_biotype:TR_J_gene
--attribute=gene_biotype:TR_J_pseudogene
--attribute=gene_biotype:TR_C_gene
- 为cellranger mkref设置命令,这个时间比较久,可能需要几个小时。
cellranger mkref --genome=mm10
--fasta=Mus_musculus.GRCm38.dna.primary_assembly.fa
--genes=Mus_musculus.GRCm38.93.filtered.gtf
--ref-version=3.0.0
- 查看运行cellranger mkref的结果是否正确 到这里自己的参考基因组就建好了,下一步就可以执行mapping了。
此外,也可以 将您的标记基因添加到FASTA和GTF中
参考:Build a Custom Reference With cellranger mkref