Probabilistic Data Association for Semantic SLAM
https://blog.csdn.net/Crazydogg/article/details/82670046
http://www.liuxiao.org/category/robots/slam/
https://blog.csdn.net/pikachu_777/article/details/86631256
一、:这个文章提出了一个概率中心的Probabilistic Data Association for Semantic SLAM重投影误差模型,使用特定的概率模型计算出来的物体中心和检测框的中心。
该论文核心为提出了一个将尺度信息和语义信息融合的理论框架,前端的选择可以基于实际情况来挑选,论文中采用的比较常用效果较好的物体检测框架。
SLAM中的概率化数据关联问题,在经典的SLAM问题中,在经典SLAM问题中,移动的传感器经过未知的环境,将M个静态路标进行建模并获取传感器测量值集合为。其任务为估计路标位置和传感器的姿态序列(即轨迹)。
在本篇论文中,提出目前大部分工作都忽略了数据关联。定义,其意义为第k组观测值是在传感器姿态下获得路标的观测。实际情况下这个数据关联是未知的,类似于无法确定当前图像中点云数据的分类。完整的SLAM数学问题模型应该是:
该论文本质上是在论述引入语义信息后,如何合理的求解该最大似然方程。
如何正确理解数据关联D:每一组D中关联的意思是指姿态和路标之间的关联。两者之间的关联这代表了测量值是在哪里看的哪个路标。
一般的SLAM过程中,姿态都是估计出来的,对应的地图路标也是估计出来的。所以求解的话我们需要先估计对应关系即数据关联D,再估计获得姿态X和路标L。引入数据关联D后,传统SLAM问题变化为:
第一步:估计数据关联D的估计
第二步:将估计的数据关联D带入下一步估计出姿态和路标
此过程中的问题是,如果第一步对数据关联估计不准,将极大的影响第二步的估计性能。并且如果一些模糊测量被舍去来避免错误的数据关联,之后即使模糊测量收敛也没有机会考虑。因此还存在一种坐标下降法(coordiante descent)迭代计算这两步:
此方法可以在姿态估计改善后,重新进行数据关联的决策。但是未解决模糊数据的处理问题,因为每一次对D的估计都是硬决策(hard decision)。
语义信息和尺度信息共同更新
为了解决模糊数据的处理问题,本文在估计X和L时把D的整体分布也考虑到一起。混合成一个优化问题,本文选择的模型是期望测量似然(expected measurement likelihood):
给定初始估计,让此期望测量似然取最大值的姿态和路标即我们需要的下一步状态。即:
其中是D取值的所有可能的空间,第二个等号的公式变形基于期望的意义,即让变量D的所有可能对应的概率取乘以取该可能是获得的因变量值。该公式中因变量即,此式求解的目的也是获得一组和 来让 在条件给定 下的期望取最大值。
本文提出基于此期望测量似然取最大值的公式,我们在估计数据关联D时就不需要强行决断一个数据关联了,传统的SLAM是一定要确定在当前姿态下观测的路标是桌上的瓶子还是地上的椅子,从而根据瓶子和椅子在地图中的位置来估计当前传感器的姿态,这即是前文所提的硬决策,此种决策不能解决模糊数据的处理问题。但本文基于期望测量似然公式提出了一个软决策,即平均所有可能的数据关联(类似于当前状态的估计来源于瓶子和椅子的一个概率分布叠加)。而该公式求解方法是期望最大值(expectation maximization),即EM法。是因子图的一种常用解法。因此期望测量最大值公式重写如下:
其中是一个与X、L无关的权重,衡量各部分对软数据关联的影响力。对于此公式的算法实现,本文提出了一个使用Proposition 1来将其与矩阵行列式的值结合在一起:
论文并证明了这个公式的合理性。
因此算法实现上就可以使用EM法来迭代求解最优估计问题:
l“E” Step:估计数据关联的概率分布作为权重,而不是估计数据关联的极大似然,即是估计一个分布而不是一个确定值。
l“M” Step:在前一步基础上,最大化期望测量似然的log值
本文中的定义理解为:第一个公式表达的是在所有数据关联下,即观测的苹果、椅子和水杯都进行一次估计然后叠加。每一次估计中,计算,看到的这个点云是姿态A处看到的苹果的概率乘以在A处看苹果所得到的真实观测是这个点云的概率,真实观测是通过在地图中模拟观测点并已知苹果位置计算的,
所有的这些可能叠加之后的值将考虑了许多方面的影响,包括姿态、路标、观测,对整体数值求最大也即最接近现实情况,此时X和L将与现实情况最接近。此时X和L即是最优估计。
总结:本文的核心目的是用语义信息辅助获得路标和摄像头姿态,将语义信息添加在数学模型中来对姿态估计造成影响。摄像头提取的语义信息反应在观测值Z中,并且包含了惯性信息和里程计信息。
浙公网安备 33010602011771号