近年来,模仿人类智能的智能机器人取得了巨大进步。然而,目前的机器人在动态环境中处理多任务方面还有较大限制。为了提高可扩展性和适应性,进一步发展智能机器人至关重要。本研究报告了一个基于无人驾驶自行车的大脑启发机器人平台,该平台具有可扩展的网络规模、数量和多样性,能够适应不断变化的需求。该平台采用丰富的编码方案和可训练、可扩展的神经状态机,实现了混合网络的灵活协作。此外,本研究使用跨范式神经形态芯片开发了嵌入式系统,以便实现各种形式的神经网络。该平台能够并行处理不同现实场景下的实时任务,为增强机器人智能提供了新的方法。
为了促进机器人模仿人类智能的研究,本研究开发了一种基于无人驾驶自行车的混合可扩展智能机器人平台。该平台主要包括视觉、听觉、运动和决策等模块,能够同时处理多模态任务。该平台的开发面临着三个主要挑战。首先,多模态数据流的不断变化涉及到时间和空间上的多种信息通道,对于收集和处理来自外部环境的不同类型信息具有挑战性。其次,单个模块的集成需要高级计划器,如何分配它们来完成系统级行为是一个挑战。第三,智能机器人需要具有网络规模、数量和多样性的可扩展性,但由于硬件限制,实现这种可伸缩性在计算系统上具有一定难度。
图1. 混合和可扩展的大脑启发机器人平台的智能架构。
为了克服上述挑战,本研究提出了三种设计原则来开发机器人平台,灵感来自人脑(图1)。首先,受大脑皮层功能专业化和丰富的编码方案启发,开发了一种混合架构,可以实现灵活的网络间协作,并有效地整合不同的编码方案。其次,为了适应动态环境,开发了一个基于混合神经状态机(HNSM)的高级决策模块,灵活地集成不同的模块,提供监督和调度不同信息流的能力,以及在实施过程中处理不断增加的任务的扩展能力。第三,受皮层柱组织的新皮层区域启发,开发了一个基于跨范式神经形态芯片“Tianjic”的可扩展计算系统,以及用于硬件和软件协同设计的定制工具链。该系统有可能支持大脑启发系统的进化和生长,类似于人类大脑的进化和生长。
图2. 机器人平台硬件系统概述。(a)带有关键传感器和电子部件的机械结构。(b)具有可扩展的神经形态计算系统和电子设备之间通信的硬件结构。
# 研究结果
系统概括
智能架构:本研究的机器人平台采用混合网络模块化设计,包括视觉、听觉、运动和决策模块(图1所示)。每个模块使用专门的神经网络,根据数据流的时空复杂性进行编码构建,并通过训练数据和学习规则改进。基于HNSM的决策模块集成多模态信息,并提供运动指令。这种混合式组织和基于网络的决策模块实现多网络集成、多模块协作、丰富的编码方案和系统可扩展性,为处理动态复杂任务提供基础,并促进持续发展。
硬件系统:机器人平台建立在一辆改装的电动自行车上,配备了一系列传感器和执行器,形成了一个与人类感觉运动系统相似的感觉运动系统(图2a)。该平台通过摄像头、无线麦克风、一组机载传感器,包括基于激光的速度计、绝对编码器、姿态和航向参考系统,共同确定平台的内部运动状态。所有传感器和执行器都连接到一个可扩展的神经形态计算系统,该系统由现场可编程门阵列(FPGA)和Tianjic芯片组成(图2b)。使用Tianjic实现了具有多种神经网络和丰富编码方案的混合架构。
图3. 混合机器人平台的网络结构与数据流。(a)基于CNN的可视化模块数据流程图及CNN示意图(输入、结构、输出)。(b)基于SNN的听觉模块及中间数据说明。(c)基于HNSM的决策模块。(d)运动模块的分装部件和数据流,包括三个功能核心和一个MLP。
混合网络模块
混合模块系统示意图如图3所示,具有多种网络类型,兼容丰富的编码方案。该系统将分层拓扑和并行网络处理相结合。为了处理时空多模态数据,根据输入数据流的特点设计了各个模块。该混合架构包括一个基于CNN的视觉模块,一个基于SNN的听觉模块和一个基于MLP的运动模块。基于HNSM的决策模块监测平台的不同状态,调度不同的神经网络,融合不同模块之间的混合信息流。
每个模块开辟了独立的数据路径,这些路径在信息表示、频率和吞吐量上都是不同的。在视觉模块中,将视频以多位值的形式馈入CNN,从而在有限的计算资源下保持丰富的环境空间信息(图3a)。原始音频流在听觉模块中被转换成二进制尖峰串。通过Mel频率倒谱系数(MFCC)得到关键频率特征。使用高斯总体将每个MFCC特征编码为尖峰序列,作为三层全连接SNN的输入(图3b)。图3c展示了基于HNSM的决策模块的结构和数据流。对于运动控制,首先由功能核心产生序列信号,与其他模块的转向指令合并,作为综合目标角度。然后通过MLP网络整合来自所有传感器的数据以进行角度控制(图3d)。
灵活的模块协作
本文设计了一种基于混合网络的高级决策状态机HNSM,该状态机不仅可以融合尖峰和非尖峰信号的混合数据流,而且可以训练以应对不同的复杂情况。图3c展示了基于HNSM的决策模块的结构和数据流,使用转换接口进行信号融合,并使用基于网络的模型进行规则学习,从而使HNSM显示出支持混合和可扩展平台的各种特性。
图4. HNSM的发展及其结果。(a)不同任务复杂度下HNSM的演化。(b) HNSM图解,包括数据流、神经元定义、矩阵关系和整体结构。(c)训练时误差传递的变化曲线。(d) T-T、T-S、S-S、S-T矩阵的权值。(e)状态维护和干扰抑制。(f)展示一个复杂的状态转换序列。
基于网络的状态机支持可伸缩性,可以通过训练和自学习来处理日益复杂的任务。HNSM由三种类型的神经元群组成:触发(T),状态(S)和输出(O),以及五个连接矩阵(T-T, T-S, S- S, S-T, S- O)(图4a)。作为一种基于网络的模型,连接矩阵的权值可以使用预设状态和外部刺激序列进行训练。关于状态、触发器和训练规则的更多细节在方法中提供。
新状态的引入有两种方式:(1)将原有的单网络模块进行扩展以完成更多的任务;(ii) HSNM容纳额外的模块。我们进行了一系列实验来评估可扩展平台,从基本任务开始,然后逐渐增加网络复杂性(图4b)。图4c绘制了训练过程中的训练误差曲线,其中误差是指神经元相对于监督器的故障活动。对于每个epoch,权重在100次迭代中更新。误差逐渐下降,并在训练结束时变为零。四个矩阵的最终权重如图4d所示。
神经元的活动由触发神经元和状态神经元在一系列外界信号作用下的膜电位来表示,可以表示状态的维持和转变(图4e和f)。当电位积累并超过阈值(黑色虚线)时,对应的神经元发射,分别激活触发信号或状态输出。由于每个状态只响应特定的触发器,其他信号被视为非法,干扰被抑制,导致状态保持良好(图4e)。为了评估HSNM的性能和网络的协作性,设计了一个复杂的任务,其中包含一个包含完整状态的过渡序列来激活我们的混合机器人平台的所有模块(图4f)。该任务涉及图4b中的所有转换规则,并且每个触发器或转换都立即执行,其间没有任何延迟。结果表明,该系统具有灵活、完美的状态转换和较强的抗噪声鲁棒性。当接收到异常的外部刺激(如图4f中的空白触发)时,虚假触发信号被自动屏蔽,以确保正确的状态转换。因此,避免了来自环境的不确定外部刺激所带来的干扰,输出稳定。
图5. 可扩展的计算平台。(a)Tianjic工具链的三级实现架构。(b)针对尖峰和非尖峰数据流的四种混合编码配置。(c)多网络制图策略流程图。(d)层次路由器结构示意图。(e)每个核心在路由器中分配通信流量。(f)不同芯数的功耗。(g)各网络的功耗分布。
可扩展的神经形态计算
为了应对复杂的环境和各种任务难度的增加,智能系统应该能够扩展以适应更多和/或更大的网络。利用HNSM在软件层面提供的灵活性和可扩展性,以及内部开发的可以映射异构多网络的工具链,构建了一个灵活和可扩展的计算平台。如图5a所示,实现架构有三个层次:(1)模型层:提供用户界面,并从原始网络中抽象编码方案、结构和权重;(2)映射层:将网络转换为对硬件友好的模型,并将其映射到逻辑核上;(3)硬件层:生成模型在Tianjic系统上运行的硬件配置文件。该计算平台通过以下方式支持网络规模、数量和多样性的可扩展性:(1)统一的功能核心,具有丰富的编码方案和混合模型的可重构单元;(2)具有灵活映射策略的自动化软硬件工具,用于多网络的实现和合并;(3)任意路由拓扑,具有层次二维网格结构,适合大规模通信和无限扩展。
对于混合网络,核心的输入和输出可以独立配置为ANN或SNN模型。对于同质或异构网络,可以生成四种类型的组合,包括ANN、SNN、ANN to SNN和SNN to ANN (A2A、S2S、A2S、S2A)(图5b)。在自行车实验中,大部分转换核(A2S和S2A)位于两个网络之间,充当接口。其次,对于多个网络,将其划分为单个网络,每个网络由自动工具链逐步部署,不受干扰;流程图如图5c所示。对于单个网络,映射编译器将原始网络模型(通常是浮点模型)转换为硬件友好的形式。然后将网络的参数逻辑地分配给多个核心。最后,将逻辑分布映射到物理位置。
对于大规模网络,采用了一些优化机制,以确保多个网络可以在芯片上高效运行。通过这种方式,可以通过平铺内核和芯片实现任意数量和大小的网络的大规模并行计算(图5d)。图5e显示了路由通道跨核通信流量的分布情况。每个核心的输入和输出路由报文随时间步长而变化。
利用上述方法,可以将混合网络映射到Tianjic芯片上,实现高速低功耗的计算性能。不同尺度下的系统功耗如图5f所示,随着核数的增加,系统功耗呈近似线性增长。对于机器人系统,实际功耗取决于实际需求。这些基于网络的模块处理不同的任务。因此,网络规模的差异是影响电力消耗的关键因素。在自行车实验中,一个芯片内使用了130个内核,总动态功率为237.45 mW(图5f中星号标记),其中视觉模块的CNN占比最大,约为83%(图5g)。由此表明,该计算系统在集成不同规模、数量和多样性的网络方面表现出较高的可扩展性。
图6. 系统级行为性能的说明。(a)具有多种任务的实际动态和复杂环境。(b)各种真实路况及相应规格。(c)自行车相对偏航角图,以及控制模块生成的目标转角图。左y轴(偏航角)由CNN预测的目标位置转换而来,右y轴(目标旋转角)由MLP生成,用于车把控制。(d)基于MLP的运动模块在不同速度水平、指令和运动模式下的性能。
系统级行为
为应对许多不确定因素,机器人在现实世界中的操作具有挑战性。在这项工作中,本研究通过一系列现实世界的测试来评估该无人自行车平台,包括不同的道路条件、各种障碍物和环境噪音。图6a显示了一些真实场景的示例。无人驾驶自行车完成了一系列的行为,包括探测和跟踪一个人,识别语音命令,并采取相应的行动。在运动场、草地、石径、地毯等不同路况下,自行车能够轻松保持平衡并通过减速带(图6b),这得益于MLP的鲁棒性和系统的低延迟。这款自行车能够跟随随意奔跑的人,并自动避开障碍物。跟踪和避障性能如图6c所示。如果另一个人突然进入视野,自行车能够继续跟踪原来的目标。图6d显示了不同速度水平和多种运动模式的结果。根据指令生成目标倾角。自行车在不同速度下分别执行圆周线、S曲线和直线,仅通过一个网络完成不同速度级别之间的无级切换。这些测试证明了该机器人平台在动态可变环境中处理多种任务的有效性。
# 结论与启发展望
本研究报告了一种混合和可扩展的大脑启发机器人平台,能够同时完成多个复杂任务,包括多模态感知、高层决策和自主运动。该平台的设计受到了人类大脑的启发,采用了混合架构来集成不同编码方案,高级决策模块来实现网络协作,以及可扩展的计算系统来支持进化。在基于该平台的无人驾驶自行车的开发中,该自行车成功完成了目标跟踪、避障、语音命令识别、平衡控制和决策等任务。
这种混合和可扩展的系统带来了前所未有的优势和潜力:
- 混合架构将结合计算机科学和神经科学的进展,推动大脑启发机器人系统的发展;
- 出色的平台扩展性、算法和计算能力将允许灵活地集成更多的传感器和功能模块,以应对复杂的场景;
- 采用跨范式神经形态计算系统的机器人平台不仅能够支持大规模和多样化的网络,还能推动在线学习的发展。
总之,该系统可作为广泛机器人研究的通用平台,涵盖感知、认知、自动控制、语言理解、决策、学习和适应等方面的基础理论和应用。此外,混合和可扩展的平台可通过迭代开发和不断改进不断完善。通过研究对外界环境变化的适应,可以探索人工通用智能面临的一些关键挑战,从而推动通用人工智能的发展。
参考内容
https://www.nature.com/articles/s41598-020-73366-9
—— End ——