短篇:call snp和GWAS的关系

2021-09-06 16:10:12 浏览数 (2)

所谓call snp,是比对SNP的过程。

我们做GWAS都有哪些步骤呢?

首先,要确定样本,无论是300个自交系群体,还是300个病人的血液或者组织样本,这些自交系或者病人都称为样本(sample),提取DNA,每个样本对应一个DNA。

然后,将DNA(或者将叶片或者组织)送到测序公司,进行二代测序或三代测序,得到DNA的片段数据,比如100bp,1000bp等等。

然后,call snp,将这些DNA片段,比对到参考基因组上,找到变异的位点,这些位点就可以称为SNP。输出后的结果是vcf或者plink格式。我们用这些数据进行后面GWAS的分析。

最后,是GWAS的分析,光有SNP还是不行的,还要有表型数据与此对应,比如株高,比如血压等等。GWAS分析模型有GLM和MLM模型,得到SNP的效应值和P值,根据P值找到显著性的SNP位点。根据SNP的位置信息和P值进行可视化绘图,主要有QQ图和曼哈顿图。

最最后,进行基因注释,看一下这些显著性的SNP都位于基因组上的什么位置,在什么基因上,附件有什么基因,这些基因有哪些功能。包括GO注释,KEGG注释。

基本就是这样。

所以,call snp是GWAS分析中获取SNP的步骤。

0 人点赞