通过孟德尔随机化研究,可以基于GWAS的结果来推断不同表型之间的因果关系, 比如使用的很广泛的两样本MR分析
对于暴露因素X和结局变量Y两个表型,以遗传变量G为工具变量,通过各自对应的gwas结果来推断二者的因果关系。
目前gwas的公开结果很多,为了更加高效准确的进行MR分析,科学家们开发了MR-base数据库。该数据库收录了1600多个公开的GWAS结果以及基因,蛋白,代谢物,甲基化等不同水平的eQTL研究结果,同时开发了一个R包TwoSampleMR,并封装成了一个web app, 以方便科研人员,高效的利用这些公共数据集开展两样本的MR(简称2SM)分析, 对应的文章链接如下
https://elifesciences.org/articles/34408
R包的源代码保存在github上, 链接如下
https://github.com/MRCIEU/TwoSampleMR 官网如下 http://www.mrbase.org/
通过官网的web app,可以方便的进行2SMR分析,整个过程分为了以下3步
1. choose exposures
选择暴露因素X对应的gwas结果,可以上传自己的gwas结果,也可以选择公共数据库。如果是自己上传结果,对格式有一定要求,必须有以下几列
- SNP
- effect allele
- beta
- se
官方的示例文件内容如下
2. choose outcomes
选择结局变量Y对应的gwas结果, 此时只能选择数据库中收录的gwas结果,示意如下
3. Run MR
运行2SMR分析, 调整参数之后,直接点击Perform MR analysis分析即可,结果示意如下
每一行代表一个不同的算法, nsnp代表模型中的SNP数量,b代笔beta, se代表标准误,pval表示p值。同时还提供了异质性和基因多效性偏倚的评估结果。当然也提供了很丰富的可视化结果,部分内容示意如下
如果想要更加灵活的进行分析,也可以直接使用TwoSampleMR这个R包,其使用手册网址如下
https://mrcieu.github.io/TwoSampleMR/
具体用法后续在详细介绍。