【文献阅读】Split-KalmanNet:一种鲁棒的基于模型的深度学习方法用于状态估计

2024-08-08 17:23:40 浏览数 (4)

论文信息

题目:Split-KalmanNet: A Robust Model-Based Deep Learning Approach for State Estimation

作者:Geon Choi , Jeonghun Park , Nir Shlezinger , Yonina C. Eldar , and Namyoon Lee

期刊:IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY (IEEE TVT)

摘要:从带噪声的测量中估计离散时间状态空间模型的状态是信号处理中的一个重要方面。扩展卡尔曼滤波器(EKF)是一种广泛使用的基于状态演化和测量模型的状态空间模型的低复杂度解决方案。然而,在实际中获取这些模型的精确信息是很困难的,并且模型失配会大幅降低状态估计精度。在本文中介绍了Split-KalmanNet,这是一种利用深度学习的鲁棒EKF算法。Split-KalmanNet受最近的KalmanNet启发,通过测量方程的雅可比矩阵和两个具有分裂结构的循环神经网络(RNN)来计算卡尔曼增益。RNNs独立的从数据中学习先验状态估计和新息的协方差矩阵。提出的分裂结构在计算卡尔曼增益的时候,可以补偿状态和测量模型失配的影响。数字仿真表明,在各种模型失配的情况下,Split-KalmanNet优于传统的EKF和最先进的KalmanNet算法。

关键词:卡尔曼滤波,基于模型的深度学习,状态空间模型,序贯状态估计

文章正文

0、引言

从含有噪声的测量中实时估计离散状态空间模型(SS)的状态这个问题,是信号处理中的一项关键任务并应用于各种领域,比如目标跟踪和定位。为了解决这个问题,低复杂度的递归贝叶斯滤波算法被提出。卡尔曼滤波(KF)是简单的最优序贯估计器,在加性高斯白噪声下的线性状态空间模型可以实现最小均方误差(MMSE)性能。许多努力被用于将KF扩展到更一般的SS模型。

最广泛的应用于非线性SS模型的状态估计算法是EKF算法。该方法充分利用从SS模型的物理动力学中获取的模型知识,并交替执行依据预定状态演化模型的状态更新和依据当前状态和带噪声测量的测量模型的测量更新。EKF是KF在非线性SS模型中的推广,并且对于线性高斯过程依然保持数学上是可处理和最优的。尽管应用广泛,这种基于模型的在线估计方法容易受到物理和统计模型不匹配的影响,当这个影响明显时,结果可能发散。

最近,基于模型的深度神经网络(DNN)辅助的卡尔曼滤波算法KalmanNet被提出。KalmanNet利用无模型DNNs学习卡尔曼增益矩阵,并将它整合到KF算法的状态和测量更新。得益于深度学习,训练后的卡尔曼增益矩阵对模型失配具有鲁棒性。然而,KalmanNet在计算卡尔曼增益时没有充分利用基于模型的结构,导致当状态和测量模型失配共存时状态估计性能损失。

在这篇文章中,介绍一种称为Split-KalmanNet的深度学习方法用于状态估计。我们的算法基于模型实现,主要概念时使用两个并行的DNNs对先验状态估计和新息协方差矩阵进行单独训练。结合学习到的协方差矩阵和测量方程的雅可比矩阵,依据标准卡尔曼增益的更新规则计算卡尔曼增益。Split-KalmanNet的分割学习结构,使得对于状态和测量模型失配的影响具有鲁棒性,它通过两个DNNs独立优化来分离这些影响。仿真结果表明,即使在状态和测量模型不匹配的情况下,相对于传统的基于模型的EKF和KalmanNet算法,所提出的算法可以显著的降低均方误差(MSE)。

1、系统模型和问题公式化

状态演变模型:

测量模型:

状态估计问题:状态估计问题的目标是根据带噪声的测量来恢复隐状态,用数学可以描述为解决以下优化问题

EKF算法为该问题提供了递归解决方案,但是其成功实施依赖于对过程和测量噪声分布的准确了解。但是,在实际中完美的获取这些信息很困难,模型失配导致EKF算法性能显著下降。因此,一种可以处理模型不匹配的鲁棒序贯状态估计算法是必要的。

2、传统方法

2.1 基于模型的EKF

状态更新:用上一时刻的后验均值和协方差来预测当前时刻的先验均值和协方差

其中雅可比矩阵

测量更新:通过当前时刻状态的先验均值来计算预测测量值

计算新息

根据状态的先验均值和新息的协方差矩阵计算卡尔曼增益:

其中,测量方程的雅可比矩阵和新息的协方差矩阵分别为:

当前时刻的状态后验均值及其协方差矩阵为:

基于模型的EKF算法在模型失配时会出现显著的性能下降。为解决这个问题,传统的解决方法是最坏情况下误差最小和系统识别方法,比如协方差矩阵自适应和期望最大化。然而它们无法适应多种SS模型,从而导致性能下降。一个替代方案是采用数据驱动的方式,它可以充分利用可获得的数据克服模型失配问题并最小化性能损失。KalmanNet使用基于模型的数据驱动方法去克服模型失配导致的性能退化。

2.2 KalmanNet - 一种混合方法

KalmanNet是一种混合方法,它利用了DNN,并且保留了递归EKF中的公式(4)(5)(6)。和基于模型的EKF算法的明显区别在于计算卡尔曼增益矩阵。不在使用公式(5)中的卡尔曼增益矩阵进行测量更新,KalmanNet使用学习得到的卡尔曼增益矩阵执行测量更新。

其中可训练参数为

卡尔曼增益通过端到端的方式优化关于参数Θ的平方误差损失函数来训练。

作为由L条不同状态-测量对轨迹组成的数据集。第

条轨迹包含

数据样本

,其中

。我们可以定义第i条训练轨迹的经验损失函数为

在时间t第L条轨迹的状态预测误差为:

测量新息为:

损失函数关于卡尔曼增益矩阵的偏导数为

将公式(9)带入下面的链式法则:

可以使用随机梯度下降算法找到局部最优参数

使得

。为了隐式的跟踪协方差矩阵,使用RNN来训练参数,使用新息差异

和状态更新差异

作为输入特征。

这种DNN辅助的EKF算法不需要知道过程和测量噪声的协方差矩阵。相反,这些矩阵是从卡尔曼增益计算数据中隐式学习得到的。因此,相对于基于模型的EKF方法,它可以减少统计学模型失配的影响。另外,它可以简化状态和时间更新步骤,因为先验协方差

和后验协方差

可以被丢弃。尽管如此,当

中的一个失配占据主导位置时,这种卡尔曼增益的联合学习方法可能会导致性能损失。例如,主要的不匹配为测量误差

阻碍了学习状态协方差矩阵

这一事实促进我们在计算卡尔曼增益时考虑分割结构。

3、Split-KalmanNet

在公式(5)中可以看到,卡尔曼增益矩阵由三个乘积因子组成:i)状态的先验协方差矩阵

,ii)测量函数的雅可比矩阵

,iii)新息协方差矩阵的逆

。第一项,

的函数。另外,最后一项,

根据测量噪声

的二阶矩变化。当

的不确定性不均匀时,端到端的KalmanNet会失去鲁棒性,因为

无法分离

统计学模型不匹配的影响。

利用过程和噪声向量的统计独立性和基于模型的知识来计算卡尔曼增益矩阵,本文的方法是利用两个独立的DNN来训练卡尔曼增益矩阵:

其中,

是隐式学习状态的先验协方差矩阵

的DNN,参数为

是另一个隐式的学习新息协方差矩阵的逆

的DNN,参数为

。通过训练得到的卡尔曼增益矩阵,Split-KalmanNet执行如下状态更新:

Split-KalmanNet的整体结构图如下:

Split-KalmanNet允许独立的学习由状态更新

和测量更新

引起的模型不确定性。此外,Split-KalmanNet分离了在计算公式(11)时测量方程的雅可比矩阵

所带来的模型不确定性的影响。因此,在模型失配不均匀的情况下,由于分割学习结构的存在,Split-KalmanNet比端到端的KalmanNet更稳健。

损失函数:和公式(8)类似,给定数据集

,我们根据两个参数集去定义损失函数

交替优化训练:通过交替优化方法来训练两个DNN。计算损失函数关于卡尔曼增益矩阵的偏导数:

然后,给定

,我们首先通过求解一阶最有条件优化

使用更新后的

,优化

使用更新后的

,通过(15)式再次更新

。重复公式(15)(16)知道参数收敛。

复杂性:相对于KalmanNet,本文算法需要在每个时间步骤计算

。然而,需要提到的是,在很多情况下可以很容易的获得

的闭式表达式,并且求解仅仅增加很少的复杂性。

输入特征:DNN

学习状态的先验协方差矩阵

学习新息协方差矩阵的逆

。为了跟踪这些协方差矩阵,我们考虑以下输入特征:

特征F1和F3表征了状态估计的不确定性,F2和F4表征了状态和测量演化过程的不确定性,F5和F6描述了测量函数的局部行为。

4、仿真结果

通过以下几种状态估计方法对比:

  • EKF(perfect):完美EKF,基于模型的EKF,使用精确参数。
  • EKF(mismatch):失配EKF,使用预定模型参数。
  • KalmanNet:使用参考文献[13]提出的输入特征{F1,F2,F3,F4}。
  • Split-KalmanNet:上面提到的输入特征{F1,F2,F3,F4,F5,F6}。

测试指标:使用均方误差MSE,定义如下

4.1 匀速圆周运动

为了说明分离架构对噪声异质性和非线性的影响,使用如下二维状态演化模型:

其中,

是欧式平面的位置向量,

是恒定的旋转速度。

测量模型考虑了线性和非线性测量:

其中,欧氏平面中,X轴和状态向量

之间的角度用弧度

表示。噪声协方差矩阵

分别设置为

。为了模拟噪声的变化,我们设置固定值

并改变

。在失配EKF中,使用

,ν的值为30 dB。

收敛性:见图2,设置显著的噪声异质性(即 ν = 40 dB)。与 KalmanNet 相比,Split-KalmanNet 的收敛速度更快,几乎达到了完美 EKF 的 MSE。

噪声异质性和非线性:研究了不同噪声异质性 ν 水平下 Split-KalmanNet 和 KalmanNet 的 MSE 性能,见图3。当噪声异质性较低时,两种算法都实现了 MMSE,相当于完美EKF。然而,随着噪声异质性的增加,KalmanNet 无法学习卡尔曼增益矩阵,其 MSE 超过了完美EKF。另一方面,Split-KalmanNet 继续实现 MMSE,证明了其对噪声异质性的鲁棒性。

在非线性测量模型中,见图4。完美EKF无法实现最优MSE,而数据驱动方法在低水平的噪声异质性超过了它。具体来说,Split-KalmanNet 的表现优于 KalmanNet,且 MSE 略低,因为它在优化卡尔曼增益时更大程度地利用了非线性。即使噪声异质性增加,Split-KalmanNet 仍然能够有效地学习卡尔曼增益,而 KalmanNet 则比较困难。这凸显了 Split-KalmanNet 与 KalmanNet 相比具有更好的鲁棒性。

时变噪声:为了模拟时变噪声统计特性,设置

其中,

是针对每个训练序列随机选择的。

在图5中,针对特定测试序列给出了瞬时损失

图。对于失配EKF,将

设置为0[dB]。结果表明,Split-KalmanNet 能够适应噪声统计不匹配的缓慢变化。然而,适应的程度可能因训练数据集的性质而异。或者,可以采用文献 [22] 中的在线半监督学习方法。在应用监督训练技术后,Split-KalmanNet 可以以无监督的方式优化参数,以适应 SS 模型的变化。

4.2 真实世界模型:Michigan NCLT数据集

使用文献 [21] 中的 Michigan NCLT 数据集评估了 Split-KalmanNet 的有效性。该数据集由 Segway 机器人的移动轨迹组成,地面真实位置和里程计读数受到噪声的影响。我们的目标是利用通过里程计获得的噪声速度读数来定位机器人的位置。为了实现这一点,我们采用了文献 [23, Ch. 19] 中的 Segway 机器人的近似恒定加速度运动模型。

我们采用采样率为 1 Hz、日期为 2012-01-22 的轨迹来训练和验证 KalmanNet 和 Split-KalmanNet。为了测试,我们使用了采样率为 1 Hz、日期为 2012-04-29 的轨迹。图 6 将 Split-KalmanNet 的有效性与其他算法进行了比较,突出了其优越性。通过 EKF 获得的轨迹由于速度误差的累积而发生旋转。但是,SplitKalmanNet 通过从数据中学习卡尔曼增益矩阵并提供更准确的定位结果来克服这一限制。这证明了 Split-KalmanNet 在实际应用中的潜力及其提供改进的状态估计的能力。

5、结论

在本文介绍了一种稳健的序贯状态估计算法,称为 Split-KalmanNet,该算法旨在处理具有模型不匹配的 SS 模型。Split-KalmanNet 采用一种独特的方法,通过两个并行 DNN 训练先验状态估计和新息的协方差矩阵。通过利用卡尔曼增益的结构,该算法使用训练后的协方差矩阵和测量函数的雅可比矩阵组成卡尔曼增益矩阵。仿真结果表明,与各种模型不匹配场景中的传统方法相比,所提出的 SplitKalmanNet 显著改善了 MSE。

参考文献

[1] S. I. Roumeliotis and G. A. Bekey, “Bayesian estimation and kalman filtering: A unified framework for mobile robot localization,” in Proc.IEEE Int. Conf. Robot. Automat., 2000, vol. 3, pp. 2985–2992.

[2] M. Bertozzi, A. Broggi, A. Fascioli, A. Tibaldi, R. Chapuis, and F. Chausse,“Pedestrian localization and tracking system with kalman filtering,” in Proc. IEEE Intell. Veh. Symp., 2004, pp. 584–589.

[3] S. Chen, “Kalman filter for robot vision: A survey,” IEEE Trans. Ind. Electron., vol. 59, no. 11, pp. 4409–4420, Nov. 2012.

[4] I. Ullah, Y. Shen, X. Su, C. Esposito, and C. Choi, “A localization based on unscented Kalman filter and particle filter localization algorithms,” IEEE Access, vol. 8, pp. 2233–2246, 2020.

[5] R. E. Kalman, “A new approach to linear filtering and prediction problems,” ASME J. Basic Eng., vol. 82, pp. 34–45, Mar. 1960.

[6] S. J. Julier and J. K. Uhlmann, “Unscented filtering and nonlinear estimation,” Proc. IEEE, vol. 92, no. 3, pp. 401–422, Mar. 2004.

[7] N. J. Gordon, D. J. Salmond, and A. F. Smith, “Novel approach to nonlinear/non-Gaussian Bayesian state estimation,” IEE Proc. F (Radar Signal Process.), vol. 140, no. 2, pp. 107–113, Apr. 1993.

[8] O. Cappé, S. J. Godsill, and E.Moulines, “An overview of existing methods and recent advances in sequential monte carlo,” Proc. IEEE, vol. 95, no. 5, pp. 899–924, May 2007.

[9] I. Arasaratnam and S. Haykin, “Cubature kalman filters,” IEEE Trans. Autom. Control, vol. 54, no. 6, pp. 1254–1269, Jun. 2009.

[10] G. A. Terejanu et al., “Extended Kalman filter tutorial,” University at Buffalo, 2008. [Online]. Available: https://homes.cs.washington.edu/todorov/ courses/cseP590/readings/tutorialEKF.pdf

[11] B. Hajek, Random Processes for Engineers. New York, NY, USA: Cambridge Univ. Press, 2015.

[12] G. A. Einicke and L. B. White, “Robust extended Kalman filtering,” IEEE Trans. Signal Process., vol. 47, no. 9, pp. 2596–2599, Sep. 1999.

[13] G. Revach, N. Shlezinger, X. Ni, A. L. Escoriza, R. J. V. Sloun, and Y. C. Eldar, “KalmaNet: Neural network aided Kalman filtering for partially known dynamics,” IEEE Trans. Signal Process., vol. 70, pp. 1532–1547, 2022.

[14] N. Shlezinger, Y. C. Eldar, and S. P. Boyd, “Model-based deep learning: On the intersection of deep learning and optimization,” IEEE Access, vol. 10, pp. 115384–115398, 2022.

[15] A. L. Escoriza, G. Revach, N. Shlezinger, and R. J. V. Sloun, “Data-driven Kalman-based velocity estimation for autonomous racing,” in Proc. IEEE Int. Conf. Auton. Syst., 2021, pp. 1–5.

[16] B.-N. Vo and W.-K. Ma, “The Gaussian mixture probability hypothesis density filter,” IEEE Trans. Signal Process., vol. 54, no. 11, pp. 4091–4104, Nov. 2006.

[17] J. Mullane, B.-N. Vo, M. D. Adams, and B.-T. Vo, “A random-finiteset approach to Bayesian SLAM,” IEEE Trans. Robot., vol. 27, no. 2, pp. 268–282, Apr. 2011.

[18] L. Xie, Y. C. Soh, and C. E. De Souza, “Robust Kalman filtering for uncertain discrete-time systems,” IEEE Trans. Autom. Control, vol. 39, no. 6, pp. 1310–1314, Jun. 1994.

[19] M. Zorzi, “Robust Kalman filtering under model perturbations,” IEEE Trans. Autom. Control, vol. 62, no. 6, pp. 2902–2907, Jun. 2017.

[20] S. Akhlaghi, N. Zhou, and Z. Huang, “Adaptive adjustment of noise covariance in Kalman filter for dynamic state estimation,” in Proc. IEEE Power Energy Soc. Gen. Meeting, 2017, pp. 1–5.

[21] N. Carlevaris-Bianco, A. K. Ushani, and R. M. Eustice, “University of michigan north campus long-term vision and lidar dataset,” Int. J. Robot. Res., vol. 35, no. 9, pp. 1023–1035, Aug. 2016.

[22] G. Revach, N. Shlezinger, T. Locher, X. Ni, R. J. V. Sloun, and Y. C. Eldar, “Unsupervised learned Kalman filtering,” in Proc. 30th Eur. Signal Process. Conf., 2022, pp. 1571–1575.

[23] M. A. Richards, J. Scheer, and W. A. Holm, Principles of Modern Radar: Basic Principles. New York, NY, USA: Scitech, 2010.

1 人点赞