Cell Systems: 微生物数据快速推断直接互作的方法FlashWeave

2022-05-17 14:29:14 浏览数 (1)

Journal: Cell Systems

IF:10.3

Published:September 2019

Link: https://www.sciencedirect.com/science/article/pii/S2405471219302716#bib2

使用:https://github.com/meringlab/FlashWeave.jl

摘要

FlashWeave是一种基于灵活的概率图形模型框架(Probabilistic Graphical Model framework) 的计算方法,可从数十万个样本微生物丰度数据集预测直接的微生物相互作用。

FlashWeave在运行时间和准确性方面都优于最先进一些其他方法。

使用FlashWeave分析了69818个公开可用的人类肠道样本数据集,并产生了迄今为止规模最大、最多样肠道微生物相互作用网络。

概率图形模型(probabilistic graphical models,PGMs)考虑微生物之间的条件依赖结构来区分直接联系和间接联系。

例如,间接(或虚假) 联系可能由物种相互间接作用(即两个物种之间通过其他中介物种传递的相互作用)或生态位和批次效应驱动。

PGM方法可以产生更稀疏和可解释的网络,典型的缺点包括需要具有足够统计能力的更大数据集和更多的计算复杂性。

FlashWeave基于共现或丰度,从大量和异质性的微生物测序样本中推断高分辨率的相互作用网络。

FlashWeave对计算速度进行了优化,并减轻了交叉研究中常见的一些已知误差,如组合效应、旁观者效应、共享生态位偏差和测序偏差。此外,它还可与环境因素(如温度和pH值)整合以估计它们对所研究的生态系统的影响,并消除由它们驱动的间接关联。最后,它减轻了由结构性的零值(即由环境或技术因素驱动的非随机的缺失)介导的未测量的混杂影响的影响。

方法

FlashWeave基于local-to-global(LGL)的学习框架。

这类的因果推理算法首先执行一个局部最优邻域搜索,推断目标变量T的所有直接相关邻居(在FlashWeave中为OTU或MV),表示估计的T的直接原因和影响(即T的马尔科夫毯(Markov blanket,MB)。

随后,个体的邻居通过组合策略连接起来,形成全局关联图。在FlashWeave中,这个步骤通过“OR”策略来执行,如果A在B的直接关联的邻域(MB)中,则在全局图中的A和B之间创建一个连接,反之亦然。

具体算法看不懂。。。

结果

图1 FlashWeave流程

A, 主要过程;

B, 间接相关如何导致假阳性结果;

C, 用法。

FlashWeave和SparCC ,eLSA ,CoNet 三种相关性推测方法;和mLDM ,SpiecEasi两种条件方法进行了比较。FlashWeave在各个指标上表现都很好。

图2 FlashWeave与最新网络推理方法的比较

A, 运行时间比较;

B, 相互作用数量;

C, 数据集预测性能。

图4 人类肠道互作网络

A,全球肠道网络(GGNcond)正、负相关;

B,有最高连接数量的前 20个OTU;

C,系统发育距离;

0 人点赞