之前文章拓展种-面积关系(SAR)为多样性-面积关系(DAR)介绍了马老师将TAR扩展为DAR的工作。3.20号ISME online了又一新作,本文章研究人类微生物相关疾病中微生物多样性与疾病之间的关系。
在人类微生物相关疾病(human microbiome-associated diseases , MADs)的研究中,目前尚不清楚是否存在一致的多样性-疾病关系(diversity-disease relationship , DDR),以及从健康和患病个体中取样的微生物群落的分类组成是否存在一致的差异。
本文从之前27个MADs的研究中选取了41项比较,研究健康和患病个体的微生物组多样性和组成。
41项比较中有30项(73%)的健康与患病个体或不同疾病的微生物组多样性无显著差异。
33项(80%)比较中健康和患病个体之间共享的OTUs比随机预期的要少,但只有49%( 20个)是显著的。
这些结果表明,与疾病相关的微生物群落的分类组成往往与健康个体不同。由于物种组成随疾病状态的变化而变化,一些微生物群落OTUs可能作为疾病的潜在诊断指标。然而,人类微生物群落的总体物种多样性并不是疾病的可靠指标。
20世纪80年代首次提出了微生物群落的物种多样性是否在人类疾病中发挥重要作用的问题。
传统的生态多样性指数(如物种丰富度和香农指数)在比较患病和健康个体的微生物群落的研究中经常被报道。
但到目前为止,已发表的研究产生了不一致的结果:患病个体的微生物组多样性可能高于、低于或与健康个体的微生物组多样性没有差异。然而大多数研究没有采用正式的统计方法或使用一致的多样性指标,这使得元分析存在问题。此外,多样性变化是导致微生物相关疾病的原因还是结果还不清楚。
本文使用微生物组相关疾病(MAD)这个术语来指那些与人类微生物组改变所改变的相关疾病。
一般情况下即使没有疾病,微生物群落的多样性也可能在人类种群之间、种群内的个体之间以及同一个体内不同的微生物群落栖息地之间存在很大差异。一般认为在健康个体中,肠道、口腔和皮肤的微生物群落相对丰富,而阴道和肺的微生物群落相对贫乏。即不同的微生物群落栖息地可能具有不同的核心微生物群和不同的基准多样性,这使得发现一般的多样性-疾病关系(DDR)相当具有挑战性。
比较微生物群落多样性的另一个挑战是,大多数物种多样性指数对样本量敏感。在现有的文献中,样本量(sample size) 这个词通常与其他几个术语互换使用,包括抽样(sampling effort)、抽样强度(sampling intensity)、测序覆盖度(sequencing coverage)或测序深度(sequencing depth)。随着样本量的增加,OTU的数量必然增加。与传统的植物和动物群落研究相比,这个问题对于研究高度多样化的微生物群落更为严重。可用稀疏性(rarefaction)和渐近物种丰富度估计(外推物种数量)可用来标准化生物多样性比较。
Colwell RK, Chao A, Gotelli NJ, LinSY, Mao CX, Chazdon RL, et al. Models and estimators linking individual-based and sample based rarefaction, extrapolation, and comparison of assemblages. J PlantEcol. 2012;5:3–21.
Chao A, Chiu CH, Jost L. Unifying species diversity, phylogenetic diversity, functional diversity and related similarity and differentiation measures through Hill numbers. Annu Rev Ecol, Evol, Syst. 2014;45:297–324. Gotelli NJ, Shimadzu H, Dornelas M, McGill B, Moyes F, Magurran AE. Community-level regulation of temporal trends in biodiversity. Sci Adv. 2017;3:e170031.
本文提出两个问题:
是否有证据表明,在患病和健康个体中存在独特的微生物组组成,或者分类组成上的差异可以用简单的抽样效应来解释?
不同微生物相关疾病的患病和健康个体的分类学多样性是否存在一致性差异?
为了解决第一个问题,采用随机化的测试来进行共有物种分析(shared species analysis,SSA)
在不同的研究中,健康和患病个体之间共有OTU的数量差异很大,这在一定程度上取决于每个组的个体数量和每个样本的读长。如果存在与疾病和健康状态相关的独特的OTU,那么这两组间共享的OTU应该相对较少。
另外,如果相同的微生物群与健康的和患病的个体相关,每一组中独特的OTU代表随机抽样效应,共有OTU的数量与随机期望的数量应该没有什么不同(无显著差异)。
该测试不仅比较了健康个体和患病个体的OTU丰富度或多样性,而且量化了两组之间的物种组成差异(OTU一致性),这是beta多样性的一个衡量指标。
Anderson MJ, Crist TO, Chase JM,Vellend M, Inouye BD, Freestone AL, et al. Navigating the multiple meanings of beta diversity: a road map for the practicing ecologist. Ecol Lett. 2011;14:19–28
设计两个算法A1和A2。A1是将每一个read随机分配成健康或患病;A2是将每个样本随机分配成健康或患病。
A1算法:
(1) 构建行为样本,列为物种的OTU表。分别计算健康和疾病OTU表的列和,即每个物种在健康或疾病处理中的OTU的总数;
(2) 上步得到的健康或疾病处理的OTU总数(分别为A和B)相加构建总的OTU表;
(3) 随机选取A个reads作为健康处理,并重新计算每个物种的OTU数量。剩下B个reads作为疾病处理,也重新计算OTU数;
(4) 重复(3)1000次,每次都计算健康和疾病处理共有的OTU。
流程示例:
A2算法:
(1) 将健康和疾病处理的OTU表中的样本(分别为a和b)求和;
(2) 随机取a个样本作为健康处理,b个为疾病处理;
(3) 重复1000次,计算共有的物种。
流程示例:
在使用A1或A2进行随机化之后,将每个伪组中(pseudo-group)的reads集合起来,并计算两个伪组之间共享的otu的数量。在随机抽样零假设(H0)下,重复随机化1000次,得到共享otu的期望数量分布。
然后将观测到的OTUs数目与模拟分布进行比较,估计随机抽样p得到观测结果的尾部概率,将这些空模型结果转换为标准化的效果:
其中SOTUobs =观察到的共享otu数量,mean(SOTUsim) = 1000个模拟组合中共享otu的平均数量,sd(SOTUsim)为1000个模拟组合的样本标准差。
为了回答第二个问题,采用Hill作为群落多样性的统一度量。
所有生物多样性研究都面临着两个共同的挑战,且都是基于对物种中个体数量的统计。第一个挑战是传统的物种丰富度分析没有纳入关于不同类群的均匀度或相对丰富度的数据;
第二个挑战是生物多样性指数对样本大小很敏感:对稀有物种(如物种丰富度)权重较大的指数对样本偏差更敏感。
Hill可以解决第一个挑战。关于Hill的介绍,见前文拓展种-面积关系(SAR)为多样性-面积关系(DAR)。Hill number分析比较了不同处理之间的alpha多样性,由于Hill仍受到样本量的影响(尤其是低阶的Hill),如果要解决第二个挑战,生态学家传统上使用稀释(rarefaction)的方法将采样曲线内插到标准化采样水平, 以比较物种丰富度和其他生物多样性指数。
但稀疏性的缺点是样本不可避免地被标准化为丰度最低的样本,大量的数据被丢弃。这个问题对于高度多样化(hyper-diverse assemblages)的微生物组合尤其严重。
McMurdie PJ, Holmes S. Waste not, want not: why rarefying microbiome data is inadmissible. PLoS Comput Biol. 2014;10: e1003531https://doi.org/10.1371/journal.pcbi.1003531
通过对物种丰富度进行估计找到渐近线的值,可以对多样性进行标准化,作为稀缺的替代策略。
这种方法估计了在假定抽样达到最大的情况下所期望的物种数量,并且在额外抽样时不会遇到更多的物种。
这种方法的唯一缺点是对于高度多样化的微生物组合丰富度的推断可能是不确定的,并具有较大的相关方差。
Chao A, Colwell RK, Lin CW, Gotelli NJ.Sufficient sampling for asymptotic minimum species richness estimators.Ecology. 2009;90:1125–33
高阶Hill(q = 1, q = 2)当它们外推到渐近线时不确定性更小。使用渐近估计可以对所有样本进行标准化,且不会丢弃任何数据。而对Hill数的外推,用的就是iNEXT包。
关于iNEXT,见前文物种数量及多样性的外推
样本
三分之二的样本来源于EMP (Earth Microbiome Project),覆盖了神经退行性疾病,炎症性肠病、肥胖症和糖尿病。
剩下三分之一来源于已发表的研究。覆盖所有五个主要的微生物群落栖息地(肠道、口腔、皮肤、肺和阴道),以及两个重要的液体栖息地(牛奶和精液)。虽然选择的数据集并不能穷尽已有的研究,但它们代表了人类MADs的最新研究。
效应量检验
d统计量作为健康(H)和患病(D)微生物组处理之间的平均多样性指标的差异,衡量每个研究的效果大小。
Compute.es这个包计算Cohen’s d-statistic
其中t为标准t检验的t值,n1和n2为两种处理的样本量。显然d统计量不受样本大小可能差异的影响。
结果
健康和患病个体之间微生物群多样性的差异
41个健康个体与患病个体的微生物组多样性比较的效果大小与平均效果大小在统计学上没有差异。
原始OTU与渐近丰富度估计值显著相关(图1),但其斜率显著大于1.0,表明覆盖范围越深(样本量越大)的组合缺失的类群越多(图1)。然而,原始OTUs和渐近值大小非常相似(图2),因此如果没有使用Hill number的渐近估计量对数据进行标准化,结果不会发生变化。
图1观察到的OTU与估计的OTU。健康个体(圆圈)和患病个体(三角形)。实现斜率为1。估计量是观察到的OTU加上组中未检测到的OTU的估计值。估计的OTU与原始OTU呈线性相关(r = 0.98, p < 0.001)
图2 q = 0(物种丰富度)是观测到的和估计的效应量。结果对于其他阶数的Hill同样成立。每个点代表一个不同的微生物组研究,研究中比较了患病个体和健康个体的多样性。
健康和患病个体间共有OTU的差异
使用A1算法,在41个比较中,有40个观察到的健康个体和患病个体之间共享OTU的数量明显小于预期。只有在细菌性阴道病研究中观察到的共有OTUs的数量与随机期望的数量相似。更保守的A2算法也观察到的健康个体和患病个体之间共享OTU的数量明显小于随机预期。综合所有比较,共享OTU数量的SES在统计上小于两种空模型算法的预期。
讨论
目前有明确的经验证据表明,生物多样性的丧失与植物、野生动物和人类的多种重要病原体的传播或疾病严重程度的上升有关。
增加作物和森林生态系统的生物多样性已被公认为是控制农业和森林害虫的有效方法之一。
人类MADs的研究表明,几乎没有证据支持一致的DDR:在大多数研究中,健康和患病个体的多样性在统计学上没有显著差异。如不考虑统计上的显著性,27个比较中有14个(52%)健康个体的微生物组多样性高于患病个体。此外,不同研究中使用的相似微生物群位点的结果并不一致。总的来说,41个比较的效果大小与平均效果大小0无统计学差异。
此研究的结果并不意味着疾病对多样性没有影响。在大多数比较中(A140/41,A2为33/41)共有的OTU比预期的要少,这表明至少有一些OTU始终与疾病状态和健康状态相关。
虽然未能检测到整体微生物群落多样性的一致变化模式,但与患病和健康个体相关的OTUs的物种组成存在可信的变化。共享物种的变化应该为人类MADs提供有希望的诊断指标。
未来需要进行进一步的研究,包括动物模型的实验研究,以确定人类的DDR模式是否不典型,或与人畜共患病或作物和森林疾病(害虫)的DDR模式是否不同。
人类MAD系统可能和其他生物差别很大。因为在许多情况下人类微生物群可能根本不是病原体或病因。对人类MADs的机理的理解还需要进一步的研究,作者认为为人类建立一个正式的DDR模式理论现在还为时过早。