通过GWAS分析可以寻找与某一疾病或性状相关的突变位点,传统的GWAS都是基于control/case的设计,通过比较健康人群和患病人群中突变位点或者基因型频率的差异,最终确定相关的位点。
对于家族遗传病而言,上述的分析策略就存在问题了。在家系中,不同世代的个体之间存在遗传关系,疾病相关的位点也会有父代传递给子代。为了将这个传递关系考虑进来,针对家族遗传病的GWAS分析,提出了新的分析方法-TDT。
TDT
全称 TRANSMISSION DISEQUILIBRIUM TEST,通过分析从父代继承的allel个数和期望的allel个数的差异,从而判断改为点是否与疾病相关。
在上述的示意图中,子代从纯合父代继承了M1
allel, 从杂合父代继承了M2
allel,由父代传递给子代的allel 就叫做 transmitted allel。
对于一个SNP位点而言,统计样本中transmitted allel 和non-transmitted allel 的个数,得到如下表格
TDT
检验的统计量计算如下
(b - c)^ 2 / (b c)
这个统计量符合自由度为1的卡方分布。
plink 软件可以进行家系数据的GWAS分析,用法如下
代码语言:javascript复制plink --file mydata --tdt
会生成plink.tdt
文件,其中每列的含义如下
Column | Meaning |
---|---|
CHR | Chromosome number |
SNP | SNP identifier |
A1 | Minor allele code |
A2 | Major allele code |
T | Transmitted minor allele count |
U | Untransmitted allele count |
OR | TDT odds ratio |
CHISQ | TDT chi-square statistic |
P | TDT asymptotic p-value |
A:U_PAR | Parental discordance counts |
CHISQ_PAR | Parental discordance statistic |
P_PAR | Parental discordance asymptotic p-value |
CHISQ_COM | Combined test statistic |
P_COM | Combined test asymptotic p-value |
P
值小于0.05的突变位点,就认为是与疾病相关的位点了。除了TDT
检验外,plink还支持其他更多的检验方法,详细用法请参考官方文档。