来源丨牛喀网
编辑丨传感器专家网
卡尔曼滤波器是传感器融合工程师用于自动驾驶汽车的工具。想象一下,你有一个雷达传感器,告诉你另一辆车距离15米,一个激光传感器说车辆距离20米。你如何协调这些传感器测量?这就是卡尔曼滤波器的功能。卡尔曼滤波在自动驾驶汽车上的应用十分广泛,本文讲述卡尔曼滤波算法,希望对你有所帮助。
卡尔曼滤波算法在控制领域有极广泛的应用,在发动机燃油喷射控制中,可以应用扩展的卡尔曼滤波理论研究瞬态工况下发动机循环进气量的最优估计算法,在雷达中,人们感兴趣的是跟踪目标,但目标的位置、速度、加速度的测量值往往在任何时候都有噪声。卡尔曼滤波利用目标的动态信息,设法去掉噪声的影响,得到一个关于目标位置的好的估计。
为了以后更好的工程实践应用卡尔曼滤波算法,今天小编带领着大家了解卡尔曼滤波算法的理论,及其在自动驾驶多传感器融合算法中的应用。
ー 1 ー
什么是卡尔曼滤波?
你可以在任何含有不确定信息的动态系统中使用卡尔曼滤波,对系统下一步的走向做出有根据的预测,即使伴随着各种干扰,卡尔曼滤波总是能指出真实发生的情况。
在连续变化的系统中使用卡尔曼滤波是非常理想的,它具有占用内存小的优点(除了前一个状态量外,不需要保留其它历史数据),并且速度很快,很适合应用于实时问题和嵌入式系统。
在Google上找到的大多数关于实现卡尔曼滤波的数学公式看起来有点晦涩难懂,这个状况有点糟糕。实际上,如果以正确的方式看待它,卡尔曼滤波是非常简单和容易理解的,下面我将用漂亮的图片和色彩清晰的阐述它,你只需要懂一些基本的概率和矩阵的知识就可以了。
ー 2 ー
我们能用卡尔曼滤波做什么?
用玩具举例:你开发了一个可以在树林里到处跑的小机器人,这个机器人需要知道它所在的确切位置才能导航。
我们可以说机器人有一个状态:
,表示位置和速度:
注意这个状态只是关于这个系统基本属性的一堆数字,它可以是任何其它的东西。在这个例子中是位置和速度,它也可以是一个容器中液体的总量,汽车发动机的温度,用户手指在触摸板上的位置坐标,或者任何你需要跟踪的信号。
这个机器人带有GPS,精度大约为10米,还算不错,但是,它需要将自己的位置精确到10米以内。树林里有很多沟壑和悬崖,如果机器人走错了一步,就有可能掉下悬崖,所以只有GPS是不够的。
或许我们知道一些机器人如何运动的信息:例如,机器人知道发送给电机的指令,知道自己是否在朝一个方向移动并且没有人干预,在下一个状态,机器人很可能朝着相同的方向移动。当然,机器人对自己的运动是一无所知的:它可能受到风吹的影响,轮子方向偏了一点,或者遇到不平的地面而翻倒。所以,轮子转过的长度并不能精确表示机器人实际行走的距离,预测也不是很完美。
GPS 传感器告诉了我们一些状态信息,我们的预测告诉了我们机器人会怎样运动,但都只是间接的,并且伴随着一些不确定和不准确性。但是,如果使用所有对我们可用的信息,我们能得到一个比任何依据自身估计更好的结果吗?回答当然是YES,这就是卡尔曼滤波的用处。
ー 3 ー
卡尔曼滤波是如何看到你的问题的?
下面我们继续以只有位置和速度这两个状态的简单例子做解释。
我们并不知道实际的位置和速度,它们之间有很多种可能正确的组合,但其中一些的可能性要大于其它部分:
卡尔曼滤波假设两个变量(位置和速度,在这个例子中)都是随机的,并且服从高斯分布。每个变量都有一个均值μ,表示随机分布的中心(最可能的状态),以及方差
,表示不确定性。
在上图中,位置和速度是不相关的,这意味着由其中一个变量的状态无法推测出另一个变量可能的值。下面的例子更有趣:位置和速度是相关的,观测特定位置的可能性取决于当前的速度:
这种情况是有可能发生的,例如,我们基于旧的位置来估计新位置。如果速度过高,我们可能已经移动很远了。如果缓慢移动,则距离不会很远。跟踪这种关系是非常重要的,因为它带给我们更多的信息:其中一个测量值告诉了我们其它变量可能的值,这就是卡尔曼滤波的目的,尽可能地在包含不确定性的测量数据中提取更多信息! :
这种相关性用协方差矩阵来表示,简而言之,矩阵中的每个元素
, 表示第 i 个和第 j 个状态变量之间的相关度。(你可能已经猜到协方差矩阵是一个对称矩阵,这意味着可以任意交换 i 和 j)。协方差矩阵通常用
来表示,其中的元素则表示为
ー 4 ー
使用矩阵来描述问题
我们基于高斯分布来建立状态变量,所以在时刻 k 需要两个信息:最佳估计
(即均值,其它地方常用 μ 表示),以及协方差矩阵
。
(当然,在这里我们只用到了位置和速度,实际上这个状态可以包含多个变量,代表任何你想表示的信息)。接下来,我们需要根据当前状态(k-1 时刻)来预测下一状态(k 时刻)。记住,我们并不知道对下一状态的所有预测中哪个是“真实”的,但我们的预测函数并不在乎。它对所有的可能性进行预测,并给出新的高斯分布。
我们可以用矩阵
来表示这个预测过程:
它将我们原始估计中的每个点都移动到了一个新的预测位置,如果原始估计是正确的话,这个新的预测位置就是系统下一步会移动到的位置。那我们又如何用矩阵来预测下一个时刻的位置和速度呢?下面用一个基本的运动学公式来表示:
现在,我们有了一个预测矩阵来表示下一时刻的状态,但是,我们仍然不知道怎么更新协方差矩阵。此时,我们需要引入另一个公式,如果我们将分布中的每个点都乘以矩阵 A,它的协方差矩阵系
会怎样变化呢?很简单,下面给出公式:
结合方程(4)和(3)得到:
ー 5 ー
外部控制量
我们并没有捕捉到一切信息,可能存在外部因素会对系统进行控制,带来一些与系统自身状态没有相关性的改变。
以火车的运动状态模型为例,火车司机可能会操纵油门,让火车加速。相同地,在我们机器人这个例子中,导航软件可能会发出一个指令让轮子转向或者停止。如果知这些额外的信息,我们可以用一个向量
来表示,将它加到我们的预测方程中做修正。
假设由于油门的设置或控制命令,我们知道了期望的加速度
,根据基本的运动学方程可以得到:
以矩阵的形式表示就是:
称为控制矩阵,
称为控制向量(对于没有外部控制的简单系统来说,这部分可以忽略)。让我们再思考一下,如果我们的预测并不是100%准确的,该怎么办呢?
ー 6 ー
外部干扰
如果这些状态量是基于系统自身的属性或者已知的外部控制作用来变化的,则不会出现什么问题。
但是,如果存在未知的干扰呢?例如,假设我们跟踪一个四旋翼飞行器,它可能会受到风的干扰,如果我们跟踪一个轮式机器人,轮子可能会打滑,或者路面上的小坡会让它减速。这样的话我们就不能继续对这些状态进行跟踪,如果没有把这些外部干扰考虑在内,我们的预测就会出现偏差。
在每次预测之后,我们可以添加一些新的不确定性来建立这种与“外界”(即我们没有跟踪的干扰)之间的不确定性模型:
原始估计中的每个状态变量更新到新的状态后,仍然服从高斯分布。我们可以说
的每个状态变量移动到了一个新的服从高斯分布的区域,协方差为
。换句话说就是,我们将这些没有被跟踪的干扰当作是协方差的
的噪声来处理。
这产生了具有不同协方差(但是具有相同的均值)的新的高斯分布。
我们通过简单地添加
得到的扩展的协方差,下面给出预测步骤的完整表达式:
由上式可知,新的最优估计是根据上一个最优估计预测的道德,并加上已知外部控制量的修正。
而新的不确定性由上一不确定性预测得到,并加上外部环境的干扰。
好了,我们对系统可能的动向有了一个模糊的估计,用
和
来表示。如果结合传感器的数据会怎样呢?
ー 7 ー
用测量值来修正估计值
我们可能会有多个传感器来测量系统当前的状态,哪个传感器具体测量的是哪个状态变量并不重要,也许一个是测量位置,一个是测量速度,每个传感器间接地告诉了我们一些状态信息。
注意,传感器读取的数据的单位和尺度有可能与我们要跟踪的状态额单位和尺度不一样,我们用矩阵
来表示传感器的数据。
我们可以计算出传感器读数的分布,用之前的表示方法如下式所示:
卡尔曼滤波的一大优点就是能处理传感器噪声,换句话说,我们的传感器或多或少都有点不可靠,并且原始估计中的每个状态可以和一定范围内的传感器读数对应起来。
从测量到的传感器数据中,我们大致能猜到系统当前处于什么状态。但是由于存在不确定性,某些状态可能比我们得到的读数更接近真实状态。
我们将这种不确定性(例如:传感器噪声)用协方差
表示,该分布的均值就是我们读取到的传感器数据,称之为:传感器噪
现在我们有了两个高斯分布,一个是在预测值附近,一个是在传感器读数附近。
我们必须在预测值(粉红色)和传感器测量值(绿色)之间找到最优解。
那么,我们最有可能的状态是什么呢?对于任何可能的度数
有两种情况:(1)传感器的测量值;(2)由前一状态得到的预测值。如果我们想知道这两种情况都可能发生的概率,将这两个高斯分布相乘就可以了。
剩下的就是重叠部分了,这个重叠部分的均值就是两个估计最可能的值,也就是给定的所有信息中的最优估计。
瞧!这个重叠的区域看起来像另一个高斯分布。
如你所见,把两个具有不同均值和方差的高斯分布相乘,你会得到一个新的具有独立均值和方差的高斯分布!下面用公式讲解。
ー 8 ー
融合高斯分布
先以一维高斯分布来分析比较简单点,具有方差
和 μ 的高斯曲线可以用下式表示:
如果把两个服从高斯分布的函数相乘会得到什么呢?
将式(9)代入到式(10)中(注意重新归一化,使总概率为1)可以得到:
将式(11)中的两个式子相同的部分用 k 表示:
下面进一步将式(12)和(13)写成矩阵的形式,如果 Σ 表示高斯分布的协方差,
表示每个维度的均值,则:
矩阵
称为卡尔曼增益,下面将会用到。放松!我们快要完成了!
将所有公式结合起来
我们有两个高斯分布,预测部分
,和测量部分
,将它们放到式(15)中算出它们之间的重叠部分:
由式(14)可得卡尔曼增益为:
将式(16)和式(17)的两边同时左乘矩阵的逆(注意
里面包含了
)将其约掉,再将式(16)的第二个等式两边同时右乘矩阵
的逆得到以下等式:
上式给出了完整的更新步骤方程。
就是新的最优估计,我们可以将它和
放到下一个预测和更新方程中不断迭代。
以上所有公式中,你只需要用到式(7)、(18)、(19)。(如果忘了的话,你可以根据式(4)和(15)重新推导一下)
我们可以用这些公式对任何线性系统建立精确的模型,对于非线性系统来说,我们使用扩展卡尔曼滤波,区别在于EKF多了一个把预测和测量部分进行线性化的过程。
ー 9 ー
自动驾驶中的传感器融合算法
追踪静止和移动的目标是自动驾驶技术领域最为需要的核心技术之一。来源于多种传感器的信号,包括摄像头,雷达,以及激光雷达(基于脉冲激光的测距设备)等传感器组合的组合体来估计位置,速度,轨迹以及目标的种类,例如其他车辆和行人。
你可能会问——为什么我们需要这么多的传感器?
这是因为每种传感器提供了追踪物体所需要的不同精度和类型的信息,尤其是在不同天气条件下。比如,以激光雷达为基础的传感器能很好地解决位置的问题,但是在糟糕的天气条件下其精度和性能都会有很大程度的下降。另一方面,雷达的空间解决方案也相对便宜很多,与此同时,在恶劣的天气条件下也能提供更准确的数据。
同样的,不像激光雷达传感器,雷达可以提供目标的速度和方位。雷达数据也是计算密集型的,因为一束激光发射非常多包含每个独立的激光点的范围的数据,它使得你必须理解你的算法。
组合来自不同传感器信息的技术称之为传感器融合技术。之所以较早的讨论这个,是因为应用在传感器融合之上的算法必须处理短暂的,充满杂讯的输入,生成可靠的运动状态估计的概率。
下面我们将展示在位置的追踪和估计中最通用的算法,卡尔曼滤波器的变种——‘扩展卡尔曼滤波器’。
1.使用激光雷达数据的基础卡尔曼滤波器:
卡尔曼滤波器的历史已经超过半个世纪,但是对于输入数据的噪声信息和状态估计的平滑来说仍然是最有效的传感器融合算法之一。它假定位置参数是符合高斯分布的,即完全可以被均值和协方差参数化:X∼N(μ, σ²)
当传感器的信息流开始的时候,卡尔曼滤波器使用一系列的状态信息来预测和衡量更新步骤去更新被追踪目标的信心值(概率)。预测和更细心的步骤如下图所示:
状态预测:
我们会使用一个简化的线性状态空间模型(链接:https://uk.mathworks.com/help/ident/ug/what-are-state-space-models.html)去阐述滤波器的工作方式. 一个系统在t时刻的线性状态可以从t-1时刻根据以下等式被估计:
衡量更新:
卡尔曼滤波器的下一部分则是去使用实测参数z去更新预测状态'x',通过缩放因子(通常称之为卡尔曼增益)成比例的计算估计值和测量值之间的误差。
你可以在以下链接中找到衡量更新等式的求导:http://web.mit.edu/kirtley/kirtley/binlustuff/literature/control/Kalman filter.pdf
举个例子
理论部分结束!让我们尝试用一些代码去表示一些卡尔曼滤波器的基础过程。
对此,我们模拟一个目标,它的状态被四维向量x=[px py vx vy]所描述。
在这个例子中测量传感器是返回位置数据但是没有速度信息的激光传感器。为了观测到速度信息我们需要使用雷达传感器数据。在接下来的章节中,当我们讨论扩展卡尔曼滤波的时候我们将会涉及到这些。
让我们以一些假设开始:
伪代码:
基础版本的卡尔曼滤波器代码步骤列在了下面。你可以找到一个基础的例子:https://github.com/asterixds/ExtendedKalmanFilter/python
最后的迭代步骤通过测量和应用预测以及滤波器的更新步骤如下所示:
代码语言:javascript复制plot_position_variance(x,P,edgecolor='r') #plot initial position and covariance in red
for z in measurements:
x,P = predict(x, P)
x,P = update(x, P,z)
plot_position_variance(x,P,edgecolor='b') #plot updates in blue
print(x)
print(P)
卡尔曼滤波器迭代:滤波器在迭代之后向真实值收敛
上方的图阐述了滤波器在每次迭代中状态向量的px,py维度和位置的协方差发生了哪些变化。红圈表示初始过程不确定性。随着预测和测量更新,我们开始有了较小的误差(半径),状态估计开始越来越精确。
如同你看到的,最终估计的状态向量x[11.99,2.05]非常接近最终的观测值,误差最小值也缩小到了0.05。
2.扩展卡尔曼滤波器——使用雷达数据
雷达数据带来了一些更困难的挑战。雷达返回数据值的是基于极坐标系,其由三个部分构成:
- ρ /Range(从原点到此的距离)
- ϕ / bearing ( ρ 和 x的夹角),
- ρ˙:接近率/距离变化率
由于没有H矩阵将状态向量映射到雷达的测量空间,我们需要一个函数h(x)来将状态空间银蛇到测量空间以测量更新步骤。这个方法是映射极坐标到笛卡尔坐标的方法的衍生方法,定义如下:
这个映射阐述了一个非线性函数,它将使得卡尔曼滤波器的过程和测量符合高斯分布的假设无效。扩展卡尔曼滤波器使用局部线性模型来逼近非线性模型,然后使用卡尔曼滤波应用到逼近值上。局部线性逼近是通过计算当前状态估计的一阶泰勒展开得出的。一阶的逼近也叫雅克比矩阵。我们不会在这里过多介绍雅克比矩阵的推到过程。相关内容在网络中可以找到优秀的介绍,但是如果你想要直接使用这些东西,你可以在以下的github引用中找到代码实例:Github Link
现实参考
你可以在github存储库中找到关于Kalman过滤器的c 编写代码:
代码示例:https://github.com/asterixds/ExtendedKalmanFilter
—— END ——