生物信息技术-chap6 微生物群落分析

2023-11-28 22:12:53 浏览数 (2)

6.1 微生物及微生物多样性

nice video!

HMP:human microbiome project(人类微生物组计划)

微生物多样性:

1.遗传多样性:也就是基因多样性。 (α、β多样性)

2.生理多样性:群落中微生物生理结构与生理功能的多样性。

3.物种多样性:群落中物种的数量和构成特点的多样性。

4.生态多样性:微生物与其他生物也就是微生物环境的关系。

6.2 微生物群落样本的分析

本文所有内容均来自于中国大学MOOC里的四川大学生物信息技术的课程内容,本人只是进行了总结。 扩增子测序

宏基因组测序

扩增子测序

  • 数据测序下机后经过一定的标准过滤之后就可以进行物种的注释
  • 主要用于研究群落的物种组成、物种间的进化关系以及群落的多样性句号。
  • 注释不到种水平

宏基因组测序

  • 信息量更多,可物种注释后进行更加深入的研究。
  • 例如,通过特定的数据库比对进行基因功能的注释和代谢途径的分析等等。
  • 可以鉴定到种水平甚至菌株水平

6.3 测序质量评估

首先,有两个常规成列的数据,分别是有效测序数据高质量测序数据,以及后面的高质量序列数的占比,是对测序结果的最直观最基本的描述。

只有当样品的数量和测序深度能够有效反映出样品中群落结构的情况,讨论样品之间的差异才是有意义的!

***

引入一个重要概念:

OTU(可操作分类单元):个人认为就是聚类降维高通量数据的一种方式,可以简化数据结构。

16S测序中阈值常设定为97%(正好对应分类学中的种水平)

***

稀疏曲线:从每个样本种随机抽取一定数量的序列,来预测样本在一系列给定的测序深度。也就是给定测序量,所可能包含的物种总数以及其中每个物种的相对丰度。

关注曲线长短平缓程度

前者反映测序量。

后者反映测序深度对于观测样本多样性的影响大小。

***

物种累积曲线

判断样本量是否足够判断样本量是否足够

6.4 物种的组成分析

测序得到的序列经过物种注释之后,每一条序列都拥有了他们自己的物种名称,以此为基础,我们可以了解单个样本中微生物群落在不同分类水平上的物种组成,以及多个样品之间的差异。

分类水平:界、门、纲、目、科、属、种

常可以用柱状图、堆积柱状图、群落组成分析饼图、Heatmap、Venn图来展现微生物群落的物种组成及差异。

指定某物种观察其在不同样本之间的差异指定某物种观察其在不同样本之间的差异
Venn图Venn图

6.5 α、β多样性

α多样性α多样性

alpha多样性主要与两个因素有关

1.物种数目,即丰富度(richness)

2.多样性,群落中物种分配上的均匀性

chao1指数和ACE指数chao1指数和ACE指数
Shannon指数Shannon指数

Simpson指数跟测序报告中规定的概念有关,可能和shanno指数含义一致或相反。

***

测序报告中常用表格测序报告中常用表格

四条曲线

稀疏曲线和物种累计曲线稀疏曲线和物种累计曲线
丰度等级曲线丰度等级曲线

***

β多样性β多样性

β多样性常用的降维方法

  • 主成分分析PCA
  • 主坐标分析PCoA
  • 非度量多维尺度分析NMDS 原理:建立一个二维或三维的坐标轴,让原来多维空间的数据投影到低维空间中来 排序:区分样本间的亲疏关系,使相似的样本距离近,相异的样本距离远。
PCA分析PCA分析

用两个主成分来解释原始数据的差异,坐标轴后的百分率所代表的主成分所能解释的原始数据的差异比例。该图横纵坐标后的数字之和说明这两种主成分可以说明约70%的数据差异。

PCoA的结果解释跟PCA的完全一样PCoA的结果解释跟PCA的完全一样
非度量多维尺度分析NMDS非度量多维尺度分析NMDS
关于应力函数值关于应力函数值

0 人点赞