孟德尔随机化之MendelianRandomization包(第三讲)

2022-08-21 17:31:24 浏览数 (1)

在前两期推送中,我和大家分别介绍了“MendelianRandomization”的IVW和median-based方法,并详细介绍了这两种方法的参数以及使用建议。在这一期的内容中,我将和大家一起学一下“MendelianRandomization”包的MR-Egger法Maximum likelihood法,后者我们通常译作极大似然估计法。

第一部分:MR-Egger方法

代码语言:javascript复制
library(MendelianRandomization) #加载R包
MRInputObject <- mr_input(bx = ldlc,bxse= ldlcse,by = chdlodds,byse = chdloddsse) #指定输入文件
EggerObject1 <-mr_egger(MRInputObject,robust = FALSE,penalized = FALSE,correl =FALSE,distribution = "normal",alpha = 0.05)

在mr_egger()函数中,所有的参数都和IVW方法中的类似,这里就不赘述了,忘记的小伙伴请看“MendelianRandomization”包的第一讲内容孟德尔随机化之MendelianRandomization包(第一讲)。

代码语言:javascript复制
EggerObject1 #查看结果

从上述结果,我们可以看出,MR的效应估计值是3.253,并且具有统计学显著性,另外由于截距项和0无显著差异,可以认为MR-Egger的结果不存在水平多效性。这里需要注意I^2_GX这一项,它是一个0到1之间的数,其值越大,说明MR估计的结果越准确,弱工具变量的偏倚就会越小【1】。

考虑到上述结果有很强的异质性,因此我们考虑采用稳健回归,并对异常的SNP(outlier)进行“惩罚”:

代码语言:javascript复制
EggerObject2 <-mr_egger(MRInputObject,robust = TRUE,penalized = TRUE,correl =FALSE,distribution = "normal",alpha = 0.05) 
EggerObject2 #查看结果

可以看出,使用稳健回归后,MR估计值的误差变小了,但显著性并未改变。这也充分说明,LDL的升高可以增加CHD的发病风险。

第二部分:Maximum likelihood方法(极大似然估计法)

总的来看,极大似然估计法和IVW法并没有本质上的区别,因此在实际的文献中,大家通常都在使用IVW法,很少去报道极大似然估计法的结果。不过,相对于IVW方法,极大似然估计法也有着自身的两点优势:(1)它充分考虑了SNP-exposure关联的不确定性,这一点在IVW的简单加权中是被忽略的;(2)它考虑了双样本MR研究中样本重叠的情况,主要是通过参数psi来控制,在样本完全不重叠的情况下(传统的独立双样本MR研究),psi为0;如果样本完全重叠的话,psi等于观察性研究中暴露和结局的相关性(相关系数)【2】。

代码语言:javascript复制
MaxLikObject1 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi =0,distribution = "normal",alpha = 0.05)

在mr_maxlik()函数中,它的参数和IVW的类似,这里就不赘述了。

代码语言:javascript复制
MaxLikObject1 # 查看结果
代码语言:javascript复制
MaxLikObject2 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.3,distribution= "normal",alpha = 0.05)
MaxLikObject2 # 查看结果
代码语言:javascript复制
MaxLikObject3 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.6,distribution= "normal",alpha = 0.05)
MaxLikObject3 # 查看结果
代码语言:javascript复制
MaxLikObject4 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.9,distribution= "normal",alpha = 0.05)
MaxLikObject4 # 查看结果

在4次极大似然估计中,米老鼠逐渐增加psi的值,我们不难发现,随着psi的增加,MR估计值的误差也在不断增加,其实也说明在样本重叠的情况下,如果exposure和outcome有较强的关联的话,所带来的误差就会比较大,因此我们提倡尽量避免样本的重叠,如果重叠了的话,建议可以使用这个极大似然估计法计算样本完全重叠的情况下的MR估计值,如果仍然显著的话,说明结果还算可靠(这个方法不提倡)。

关于使用“MendelianRandomization”包进行MR-Egger分析和Maximum Likelihood分析的内容就讲到这里,大家要注意:(1) MR-Egger有助于辅助判断水平多效性和弱工具变量偏倚;(2)Maximum Likelihood有助于判断样本重叠带来的偏倚。咱们下期见!

参考文献:

【1】I-squared statistic: Jack Bowden and others. Assessing the suitabilityof summary data for Mendelian randomization analyses using MR-Egger regression:The role of the I2 statistic. Int J Epidemiol 2016

【2】Stephen Burgess, Adam S Butterworth, Simon G Thompson. Mendelianrandomization analysis with multiple genetic variants using summarized data.Genetic Epidemiology 2013; 37:658-665. doi: 10.1002/gepi.21758.

0 人点赞