孟德尔随机化研究的正确进行依赖于其三原则,今天米老鼠先带大家简单复习一下:
(1) 遗传变异与暴露有关。
(2) 该遗传变异与暴露-结果关联的任何混杂因素均不相关。
(3) 该遗传变异不会影响结果,除非可能通过与暴露的关联来实现。
这里面最好验证的其实也就第一条假设,第二条和第三条假设很多时候是很难去检验的,因此也很难去完全满足。简单点,我们通常也就依据P值来看是否满足这些条件。但是后两条假设其实对结果往往有着很大的影响,我们需要好好思考。
现在研究的比较多的是水平多效性(也即第二条假设),今天我就和大家聊聊如何用“MR-PRESSO”这个R包来进行水平多效性检验。
“MR-PRESSO”方法发表于2018年5月的《nature genetics》上(PMID: 29686387),是目前应用比较广泛的检验水平多效性的方法。
它的核心包含三部分:
(1)利用“MR-PRESSO global test”检测水平多效性是否存在
(2)利用“MR-PRESSO outlier test”来剔除异常SNP(outliers)并估计矫正后的结果(此结果去除了水平多效性)
(3)利用“MR-PRESSO distortion test”来检验矫正前和矫正后的结果是否存在差异
接下来我将给大家详细介绍:
核心1---“MR-PRESSO global test”(如下图所示)
该检验的核心是:对于每一个SNP,首先计算去除该SNP后的IVW结果,然后再计算该SNP的效应与IVW结果的残差平方和,其实也就是计算该SNP到去掉该SNP计算出的拟合线的距离。最后,我们会把利用每个SNP计算出来的残差平方和(距离)相加,这个值越大,说明水平多效性越显著。
核心2---“MR-PRESSO outlier test”(如下图所示)
这个检验其实和前面说的相似,它这里是比较单个SNP到拟合线的距离,距离越大,越说明这个SNP可能是一个outlier,它可能存在水平多效性,我们需要去除。从图中我们不难看出,SNP1(蓝色)和SNP2(红色)均为outlier。
核心3---“MR-PRESSO distortion test”(如下图所示)
这个检验其实很简单,就是比较去掉outliers之前和之后的结果的差异,如果差异较大,说明结果可能有所扭曲(distortion)。
“MR-PRESSO”包的基本原理讲解完毕,咱们下期简单介绍一下它的应用。