Scene object recognition for mobile robots through Semantic Knowledge and Probabilistic Graphical Models

这篇文章是针对于上一篇文章Exploiting semantic knowledge for robot object recognition的扩展以及更加具体的实现

主要是针对概率图模型在融合contextual relations时出现的几点问题来做改善与研究,系统需要处理大量的如下问题:

1)possible object classes 2)objects in the scene  3)feature used to describe the objects and their context

在处理这些问题时,推理过程的计算消耗是十分巨大的。因此,使用PGM里面两种经典的近似方法ICM和Graph Cuts可以减少计算复杂性

本文主要贡献:

1)测试了PGM-SK框架在两个数据集上的效果NYU2以及UMA-offices

2)精确推理的可行性分析。由于NYU2上的类别数更多,使用exact inference会带来更大的计算量

3)两种近似推理方法的研究,即ICM和Graph Cuts

作者提到,虽然文章中处理物体识别的问题是针对于点云的,但是整个系统框架同样适用于RGB images。

整体框架:

核心在于灰色部分构成的semantic knowledge.

1)本体来源有很多,这里主要是通过专家启发的方式来定义

2)假设生成。

  通过feature extraction以及来自于ontology的object class构成unary features、最后通过logical reasoner来推理出一系列的类,进而削减了要处理的类别数。比如,检测到一块区域x,得到了其垂直距离,朝向,区域大小等信息,就可以使用逻辑推理器来推理出x所可能属于的几类,这样就将标签数缩减了。
3)Frequency of occurrence as prior
  unary factors U(·)在CRF中给出了一个确定的类x的兼容性。pairwise factors则制定了基于上下文的特征。这一步骤中,作者提出将物体出现频率作为额外的先验信息输入至条件随机场中,帮助改善识别效果。最后重新构造了unary 函数。

实验评价:

主要是针对是三个方面来进行实验:

1)上下文信息存在与否

2)假设的生成与否

3)先验知识的存在与否

posted on 2017-05-19 22:12  操锅  阅读(104)  评论(0)    收藏  举报

导航