网络神经科学是一个蓬勃发展且迅速扩展的领域。从分子到行为尺度的大脑网络的数据的规模和复杂性都在不断增加。这些数据的发展对建模和分析大脑网络数据的合适工具和方法具有强烈的需求,例如由图论提供的工具和方法。本文概述了一些最常用的,且在神经生物学上富有洞察力的图度量方法和技术。其中,网络社区或模块化的检测,以及对促进通信和信号传输的中心节点的识别尤为突出。在这个领域,一些新兴的趋势是生成模型、动态(时变)和多层网络的日益广泛使用,以及代数拓扑的应用。总的来说,图论方法对于理解大脑网络的结构、发展和进化至关重要。本文发表于Dialogues Clin Neurosci杂志。。
温故而知新,建议结合以下脑网络相关解读阅读
大脑网络结构、功能和控制的物理学
脑网络研究中的图论指标详解
从宏观尺度脑网络的角度看结构--功能关系
图论在静息态和动态脑连接评估中的应用:构建脑网络的方法
脑网络组织的经济性
儿童神经认知网络的动态功能连接
动态功能连接:前景、问题和解释
Nature reviews Neuroscience:认知加工相关的默认网络
自闭症研究中的默认网络
默认网络:最新的解剖、生理研究及其研究发展过程中的新观点
DMN:大脑的默认网络
脑网络核心节点的发育
Biological Psychiatry:抑郁症,神经影像学和连接组学
PLOS Biology:重度抑郁症多成像中心的泛化脑网络标志物
Biological Psychiatry:精分患者大脑的组织体积变化与脑网络
Neuron:从简单映射到多维网络
脑网络视角下的精神分裂症
基于人脑连接组学将疾病症状映射于脑网络
大脑连接障碍中跨脑疾病的连接
现代物理评论:大脑网络中的动力学控制
图论在识别人脑网络连通性模式中的应用
网络神经科学中模型的性质和使用
动态脑网络与创造力
引言
21世纪一些最艰巨的科学挑战涉及复杂的社会、技术和生物系统——从全球金融和经济网络的稳定到流行病的传播、生态系统中生物相互作用的网络,以及细胞和组织内的代谢和转录过程。理解复杂性的一个重要的理论基础是网络科学,它关注由众多元素组成及其相互作用的系统的结构和功能。在过去的几十年里,网络视角在神经科学领域取得了相当大的进展。大脑网络已经成为一个丰富的研究领域(现在被称为网络神经科学),涉及不同的尺度,从相互作用的生物分子一直到社会行为。一个主要的驱动力就是数学和计算网络科学工具在神经生物学系统中的应用,特别是图论的模型和度量。
图论是数学的一个分支,可以追溯到18世纪。如今,图论的应用遍及所有的科学学科以及许多现代信息和计算技术。大脑天然适合图论方法,因为它很容易表示为元素及其成对互连(也称为节点和边)的网络(即“图”)。全面的大脑连接图谱的研究催生了新兴的连接组学领域,该领域的核心焦点就是对大脑网络和图的系统的定量的研究。
如果应用得当,图论方法可以为网络化大脑系统的结构和功能提供重要的新见解,包括其结构、进化、发育和临床疾病。本文简要概述了一些最相关的图论方法,并说明了它们在各种神经生物学背景中的应用。这里的重点是强调一些新的方法论趋势,讨论它们在大脑数据中的应用,并提出图模型和度量的未来途径。
基本概念
网络或图是元素(节点、顶点)及其成对连接(边、连接)的集合,其最简单的形式可以概括为连接(或邻接)矩阵的形式。所有成对连接的完整集合定义了图的拓扑结构,提供了节点和边之间所有关系的完整映射。大脑节点可能是单个神经元或整个大脑区域,这取决于测量技术。边可以采用二进制值或加权值,边可以是有向的,也可以是无向的,这取决于如何根据真实数据估计交互作用。选择合适的图论方法来建模和分析真实数据需要考虑边表示的性质。换句话说,并不是所有的图论方法都适合所有的目的。
两种最常见的脑图描述了神经元之间的结构和功能连接。结构网络通常是稀疏的(在一个给定的神经系统中,大多数可能的结构连接并不存在)和时间上相对稳定的(但受可塑性和发育的影响)。相比之下,功能图记录了神经元时间序列之间的统计依赖关系,因此通常是密集且随时间高度变化的。结构图和函数图的二分法是很重要的,因为每个领域都利用了与数据起源相称的图论方法的一个特定子集。
节点的定义通常需要复杂的数据处理管道,并且是许多方法学讨论的主题。在通过神经成像获得的全脑网络中,节点通常来自原始体素级数据的分割,旨在提取形成结构性或功能性脑网络的构建块的一致性的大脑“区域”。有些方法利用了解剖学模板,而另一些方法则以数据驱动的方式进行分割(例如,通过边界检测和连通性的聚类模式)。最近的一项多模态研究使用机器学习,根据几种不同的解剖和功能标准提取一致性的脑区。在对回路和神经元群体的研究中,节点的定义要简单得多,其中单个神经元是单个网络节点的自然候选对象。
目前大多数图论应用中固有的一个主要简化是假设“在一个给定的网络表示中,所有的节点和边都是相同的和同质的”。节点和边的注释可以通过允许将额外的数据层连接到网络元素来解决简单图的这种限制,这对于识别具有生物学意义的网络社区很有用。对简单图的进一步阐述是包含可以在多层网络中表达的多维关系,其中多层网络是由编码不同类型交互的不同层组成(例如突触连接、时间相关性、递质系统或基因共表达)。
图可以在不同的尺度上进行研究,特定的度量可以在局部(节点)和全局(网络范围)尺度上捕获图属性。节点度量包括简单的统计数据,如节点度或强度,而全局度量表示网络范围内的属性,如路径长度或效率。中间尺度可以通过单个图元素周围的分层邻域或通过考虑子图或模块来获取。模块是网络节点及其相互边的子集,其连通性模式可划分为不同的模、块类别。在真实网络中,这些类别通常出现在可与适当(随机)零模型的分布进行比较的特征频率中。在大脑中,模块分析已被广泛应用于结构图和功能图。
大多数高分辨率的大脑结构网络并不是完全相连的,甚至也不是紧密相连的。在这种稀疏连通的图中,两个节点之间的最小拓扑距离(即最短路径的长度),往往涉及多个步骤。网络路径由只遍历一次的唯一边组成,而两个节点之间通常更丰富的游走可以多次使用边。路径和游走被认为对信号和通信很重要,也是流行的图度量(例如所谓的效率,它定义了图通过短路径传递信息的全局能力)的基础。重要的是,路径长度和效率的概念最自然地应用于表示结构连通性的大脑图。相比之下,当应用于功能连接时,它们有相当不同的(并且可能存在问题的)的解释。这种区别源于功能连接的本质,它报告的是神经时间序列之间的统计关联,而不是传播神经信号的物理连接网络。
模块
大脑网络中最广泛使用和最具有生物学意义的方面是将它们组织成不同的网络社区或模块(见图1)。模块可用于将较大的网络划分为基本的“构建块”,即内部紧密连接的集群(集群之间的相互连接较弱)。模块化划分具有神经生物学意义,因为其边界分离了功能相关的神经元,定义了连接社区的关键桥梁和枢纽,引导和约束了神经信号和信息的流动,并限制了扰动的不受控制的传播。
图1.模块。
(A)示意网络图显示了一组节点和边相互连接,形成两个相对不同的模块(社区)。请注意,这两个模块通过一个核心节点(黑色)连接,该核心节点维持两个模块之间的两个桥接。
图(B)到(E)使用了参考文献74中的77个节点的数据集,代表大鼠大脑皮层的77个区域和定向加权投影。(B)顶部的图显示了随着分辨率参数的值从0.1增加到4.0,模块数量的变化。在此范围内,检测到的模块数量从1个增加到22个。
(C)矩阵图表示在上面绘制的分辨率参数范围内所有检测到的分区之间的信息变化。深蓝色对应的是信息的变化(距离)为零,即恒等。gamma=0.7附近的区域是该范围内最均匀的区域。
(D)大鼠大脑皮层连接矩阵(权重以对数尺度显示),按照gamma=0.7的模块分配重新排序。这三个模块用白色边界表示。
(E)使用参考文献37中描述的方法计算的多尺度共分配矩阵。共分配在1(在所有尺度上的同一模块中的节点对)到0(从不在任何尺度上共分配的节点对)之间变化。底部的树图显示了所有分层聚类解决方案,上面的那个对应于图 (C) 中相同的三个模块。在这三个模块中,都可以检测到额外的模块化结构。
从复杂的网络中提取社区和模块的计算技术有很多。网络神经科学中最广泛使用的方法之一是模块度最大化,其目的是通过最大化全局目标函数(模块化度量),将给定的网络划分为一组不重叠的社区。最初,模块化度量是用来检测相对于保度零模型而言内部连接密度最大的社区。最近,已经提出了可应用于有向符号网络的度量变体。特别值得注意的是,该方案的变体被设计用来处理相关矩阵,这是一种在功能连接的研究中经常遇到的数据类型。
模块度最大化面临着需要解决的重要的方法限制。一个限制是指存在几个(通常是相当多的)不同的分区,它们在模块化度量下几乎同样是最优的(即退化的)。考虑到网络拓扑的真实估计的固有噪声,选择单个“最优”分区作为网络社区结构的唯一代表似乎是武断的。相反,应该将多个退化解聚合为共识分区,例如,通过形成一个协方差矩阵,然后可以对该矩阵进行重新集群,直到出现单个的共识分区。这种共识方法的应用还可以揭示社区组织的其他方面,包括单个节点与其宿主社区的关联程度。
另一个基本的限制是原始的模块化度量无法检测到低于一定大小的模块。这个分辨率限制可以通过多种方式来解决。一种常见的方法是在模块化度量中包含一个额外的分辨率参数,以重新缩放内在的零模型,并允许检测更小或更大的社区。改变分辨率参数是很重要的,因为许多大脑网络表现出不同尺度的社区,这使得选择单一尺度的分析可能存在潜在的问题。例如,当社区检测方法被用于识别大脑的特定分区为静息态功能网络或“功能系统”时,这个问题就变得具有基本的神经生物学重要性。虽然一些具有里程碑意义的研究提出了此类网络的规范分区(目前已广泛应用于该领域),应该注意的是,更精细和更粗尺度的其他分区可能代表了额外的组织级别。到目前为止,大多数研究通过选择一个或几个分辨率参数的设置来规避完整的多尺度分析,通常是基于分区稳定性的一些标准。
保存和表示大脑网络的完整多尺度结构的一种方法是跨多个空间分辨率执行聚类方法,该方法将整个可能的空间分辨率范围内的采样与层次聚类相结合。该方法返回一个共分配矩阵,该矩阵捕获了随着尺度的变化,每个节点对在同一社区中保持关联的概率,以及一个说明它们之间相互关系的层次结构。多分辨率聚类方法提供了比单个分区更完整的社区结构图,避免了在大脑网络中选择相关尺度时使用复杂且往往过于随意的模型。
最后,需要注意上述用于检测大脑网络中社区的框架的许多扩展。虽然模块度最大化检测到非重叠的社区,但将模块定义为重叠的社区(即一些或所有节点保持多个从属关系的节点集)也可能很有用。其他方法,如多层模块化,被设计用来跨时间跟踪模块化分区及其节点成员关系。另一个在社会科学中有着深厚历史渊源的有前途的途径是:块模型。块建模尝试将用于生成网络的统计模型与真实数据相匹配,以识别那些提供最佳匹配的模型参数。例如,这些参数可以对应于多个块和对应的块内部和块之间的连接概率。由于块模型不局限于严格的模块化排列(即最大化模块内密度且最小化模块间密度),所以它们可以检测到网络中更复杂的块结构,包括密集核心和更弱连接外围的存在。除了多功能性之外,块模型还提供了将生成模型与数据相匹配的优势(见下文),这可能提供了对所观察到的网络拓扑结构的基础过程的深入了解。
中心性和通信
真实网络的架构与经典随机图模型有很大的不同——最重要的是,它们的节点和边在与网络其余部分的连接方式上并不相等。节点和边嵌入到整体拓扑中的方式远非“等势”,这在决定它们对网络功能的具体贡献方面发挥着重要作用。因此,网络理论调和了功能专门化与分布式处理——这种二分法在过去导致了关于大脑功能理论的强烈两级分化,不利于科学进步。
事实上,绘制大脑连接图的一个主要理由来自于大脑连通性推动局部网络元素的功能专门化的想法。这一想法是一种固有的观念,即不同的大脑区域具有独特的连通性指纹,这些指纹表明它们的网络嵌入并预测它们的功能角色。连通性指纹之间的相似性可以提供有关区域的功能分组及其相互关系的信息。
许多度量都量化了单个节点和边影响网络全局状态的潜力。其中很多都允许识别网络枢纽(通常被定义为网络的高度中心部分)。一个节点保持的连接数(节点度)或这些连接的组合权重(节点强度)通常提供了中心性的有力指标。中心性的其他度量利用网络内最短路径的布局,并记录通过给定节点或边的此类路径的数量,这种度量称为介数。另一种处理中心性的方法是参考节点和边与网络社区结构的关系。参与系数量化了给定节点跨多个模块的连接的多样性——高参与表明这些连接中有许多是跨模块建立的,因此在结构和功能上连接了不同的社区。这种度量在大脑网络中特别有用,因为它可以同时应用于结构网络和功能网络数据。
大多数节点中心性的度量是相互关联的(因此在统计上是相关的);例如,在大多数(但不是所有)网络中,具有许多连接(高度)的节点还充当许多短路径(高介数)的中介。由于不同的中心性度量反映了网络组织的不同方面,因此通过聚合多个中心性度量来对节点进行排序是有益的。
中心性度量可以成为绘制大脑网络全局结构的有用工具。神经生物学特别感兴趣的是高度中心(如高度)节点之间的相互关联。如果这些节点保持的相互连接比偶然时所预料的(即合适的零模型)更紧密,则该网络被称为“富人俱乐部组织”(见图2)。从人类的结构连接体到无脊椎动物的连接体,几乎在所有的结构连接数据中都发现了富人俱乐部。富人俱乐部组织倾向于集中网络流量,因为由相互连接的高度节点形成的密集核心吸引了大量将低度节点彼此连接起来的短网络路径。这一在网络通信中的重要作用被认为可以提高网络通信和效率,从而抵消连接空间分布的枢纽区域所涉及的高布线成本。
图2.路径和富人俱乐部组织。
(A)网络示意图,该图说明了连接两个用黑色表示的节点的一条最佳短路径(长度为三步);中间节点用灰色表示。
(B)左图:使用参考文献74中的大鼠大脑皮层数据集,该图显示了子图的密度,与保留度序列的零模型相比,子图的大小从1增加到N(N=77),节点则是按总度排列。大小为1的子图包含具有最高度的单个节点,大小为2的子图包含两个最高度的节点,以此类推。红色数据点表示密度显著高于零模型的子图(P<0.001,FDR校正)。
中图:大鼠大脑皮层连接矩阵,节点按总度数排列(最高度节点在顶行和最左列)。注意,前15个高度节点(白线)之间存在密集(几乎完全)连接。
右图:以与中图相同的节点顺序显示的边介数。注意,在矩阵的左上部分有许多具有高边介数的边。这些边连接高度节点,它们还参与了网络中的大量最短路径。
虽然人们对中心性的兴趣大多是基于枢纽在网络通信中的假定作用,但应该注意的是,大脑网络通信的机制仍然不清楚。大多数模型及其相关的图论指标都假设通信沿着最有效、最短的可用路径展开。然而,这一想法忽略了这样一个事实,即在缺乏网络拓扑结构全局信息的情况下,神经元或信号无法发现这些路径。因此,基于传播和扩散以及路径集合的替代模型在未来的研究中具有重要意义。
新兴趋势
最后一节简要回顾了几个在未来脑网络应用中具有巨大潜力的新方向。
生成模型
目前大多数应用于大脑数据的图论方法提供描述性统计,这些统计数据捕获了网络结构的各个方面。虽然这些度量可以提供关于特定的真实的测量网络的拓扑特征的信息,但它们的估计应该始终伴随着一些统计显著性或证据的估算。每个图,甚至是一个完全随机过程生成的图,都会显示一些图属性,包括一些偶然级别的聚类和模块化。零模型是描述性图分析的重要辅助工具,因为它们允许区分哪些图属性是偶然的,哪些超过了零模型给出的期望值。选择一个合适的零模型对于任何描述性分析都是至关重要的,因为它将决定哪些图的特征能够在统计比较中存活下来。经典的零模型涉及通过交换连接对真实图进行重新布线,从而在全局图结构随机化的同时保留局部度。其他的零模型保留子图频率以估计较大的子图分布的显著性,或保留节点的空间位置的零模型。
零模型固定了许多不同的因素,如局部节点度量、空间位置和布线成本,可以有效地成为真实数据的生成模型。它们生成的图可能与真实网络无法区分,在这个意义上可以解释其拓扑属性。因此,生成模型可以提供重要的视角来了解影响特定结构或性能特征出现的因素。因而它们是重要的提醒:并非所有图属性都是适应的产物,而是可能一直作为“拱肩”出现,仅仅是其他更基本的生成因素(如度分布或空间嵌入)的副产品。从生成模型的设计中可以得到的另一个重要的见解是,许多图属性是相互依赖的,并且是由一组共同的驱动因素联合产生的。例如,高聚类总是与倾向于三角形的子图的特定统计数据相关联,并且受到空间嵌入和布线保护的强烈支持。
空间嵌入作为大脑图组织背后的一个重要生成原则值得特别一提,因为它是对大脑结构的一个基本约束。许多证据表明,距离依赖是控制大脑区域局部回路中解剖性大脑连接拓扑结构以及区域间投射的主要规则。将空间嵌入与其他非空间拓扑规则相结合的生成模型表明,它们的相互权衡可能比任何单一(空间或拓扑)因素更充分地解释了大脑拓扑的特征。
生成模型对于理解动态状态和功能连接的出现也是至关重要的。计算神经科学中探索的许多经典模型都是生成模型,因为它们试图从简单的生物物理和结构成分中生成神经元活动和动力学。在人类神经影像学中,结构和功能连接之间的关系已经通过使用可以捕获大脑动力学中表现出的一些模式的计算模型来阐明。其中一些生成模型很简单,因为它们可以在结构图的基础上进行分析计算,或者对神经元动力学的性质进行最小假设(如线性假设)。其他模型利用详尽的生物物理机制来生成神经元的时间序列和集群活动。在不同的刺激和任务条件下,结合模型选择实现大量具有不同模型参数的生成模型是估计网络参数的变化(包括因果效应)的核心。
动态网络
大脑网络并不是一成改变的静态结构——相反,它们的结构和功能连接模式会在多个时间尺度上发生变化。随时间变化的脑图数据通常采用时间序列(或堆栈)的形式,这些图形成了一系列有序的快照,例如在学习过程中或跨发展阶段所记录的快照。网络拓扑的变化可以通过计算每个时间点上的图度量来跟踪,然后检查生成的图度量的时间进程。另一种分析方法是将这个堆栈排列成一系列相互耦合的时间片,它们可以作为一个单一的图结构进行分析。这允许推导出灵活性的节点度量,它可以确定在学习或发展过程中更多变的网络部分。
最近,人们花费了大量的精力来追踪利用功能磁共振成像(fMRI)记录的图拓扑结构和功能网络组织的快速变化。最常见的情况是,长时间序列的fMRI激活被划分为更短的“窗口”,然后分别进行分析。可能的混淆是测量伪影,如生理噪声和在短样本上估计功能连接大小的增加的不确定性。在静息状态下,fMRI网络似乎在更高的整合和分离状态或模块化之间经历波动。
多层网络
多组学数据的出现使得不同组织层次的神经生物系统元素之间的网络联合分析成为可能。最典型的例子是最近结合解剖和功能网络图谱的研究,以及将大规模大脑连接数据与基因表达模式的空间注册数据结合起来的研究。后者对网络元素的中心性(例如它们在一个密集的核心或富人俱乐部的成员资格)和能量代谢中独特的遗传特征之间的关系产生了重要的见解。在到目前为止的大多数研究中,图论分析是通过对不同层次(如解剖学和遗传学)的图度量的简单比较或相关性进行的。将来,可能会更明确地使用多层图框架。一些早期的例子是将结构和功能连接置于多层模型中的研究,例如,利用来自人类神经成像和脑磁图的数据。
代数拓扑
到目前为止讨论的所有图论方法都建立在由成对(二元)交互作用组成的网络上。然而,高阶交互作用可以为理解大脑网络的非随机属性提供大量信息。这种高阶关系可以用应用代数拓扑中的工具来表示,如所谓的单纯复形。单纯复形(简称为单形)从顶点集合的角度重新定义了关系数据的问题:0-单形是一个节点,1-单形是一条边,2-单形是一个填充的(连通的)三角形。单形可以用来定位团(完全连接的子图)或空腔。最近,单形在人类连接组数据上的应用表明,该方法在识别密集连接的节点组以及有助于并行处理的其他连接模式(如环状路径)。最后,拓扑数据分析的相关领域试图检测、量化和比较复杂网络数据中存在的中尺度结构。本质上,该方法试图以一种提供其全局结构的最优解的方式嵌入数据。最近的一个例子使用拓扑数据分析通过在单个参与者层面上创建单个图像帧之间的关系的图表征,来揭示多任务fMRI时间序列中的动态组织。这些表征可以比较个体在多个认知任务和状态之间转换方式,并可以为临床诊断和治疗提供有用的标记。总的来说,这些拓扑方法的出现利用了大脑数据中的高阶和高维特征,这是迄今为止简单的图方法无法实现的,因此是未来研究的有希望的途径。
结论
网络神经科学在过去的十年或二十年里的发展令人震惊。这种快速扩展的主要驱动力是记录神经系统元素之间耦合和交互的关系数据的可用性。目前,大多数研究仍然是描述性的,并且完全集中于成对的交互,从而产生由二元连接组成的图。但是图论比目前应用于大脑网络的方法所显示的要强大得多。生成模型、动态网络、多层模型和代数拓扑结构只是目前所追求的几个有前途的方向。随着时间的推移,这些新方法可能不仅会在基础研究中得到应用,还会在临床和转化研究中得到应用。在未来的几年里,图论方法将仍然是我们进一步理解大脑作为一个复杂的互连系统的不可或缺的工具。