所谓call snp,是比对SNP的过程。
我们做GWAS都有哪些步骤呢?
首先,要确定样本,无论是300个自交系群体,还是300个病人的血液或者组织样本,这些自交系或者病人都称为样本(sample),提取DNA,每个样本对应一个DNA。
然后,将DNA(或者将叶片或者组织)送到测序公司,进行二代测序或三代测序,得到DNA的片段数据,比如100bp,1000bp等等。
然后,call snp,将这些DNA片段,比对到参考基因组上,找到变异的位点,这些位点就可以称为SNP。输出后的结果是vcf或者plink格式。我们用这些数据进行后面GWAS的分析。
最后,是GWAS的分析,光有SNP还是不行的,还要有表型数据与此对应,比如株高,比如血压等等。GWAS分析模型有GLM和MLM模型,得到SNP的效应值和P值,根据P值找到显著性的SNP位点。根据SNP的位置信息和P值进行可视化绘图,主要有QQ图和曼哈顿图。
最最后,进行基因注释,看一下这些显著性的SNP都位于基因组上的什么位置,在什么基因上,附件有什么基因,这些基因有哪些功能。包括GO注释,KEGG注释。
基本就是这样。
所以,call snp是GWAS分析中获取SNP的步骤。