Hybrid Knowledge Routed Modules for Large-scaleObject Detection翻译

用于大规模目标检测的混合知识路由模块

摘要:

主要的目标检测方法分别处理每个区域的识别,忽略了一个场景中对象之间的关键语义关联。这种模式在面临严重的长尾问题时会导致性能下降,很少有样本可用于罕见的分类和许多令人困惑的类别存在。我们利用不同的人类常识知识对大规模的对象类别进行推理,并在一个图像中达到语义一致性。特别是,我们提出了混合知识路由模块(hkrm),它结合了由两种知识形式路由的推理:一种用于结构化约束的明确知识模块,用有关概念的语言知识(如共享属性、关系)进行概括;以及anim。描述一些隐含约束(如公共空间布局)的plicit知识模块。通过在一个区域到区域的图形上运行,这两个模块都可以进行个性化和调整,以在特定知识形式的指导下与每个图像中的视觉模式相协调。hkrm重量轻,通用性强,可扩展性强,易于整合多种知识,赋予任何检测网络全局语义推理能力。在大尺度物体检测基准上的实验表明,hkrm对视觉基因组(1000个类别)的改善率约为34.5%,在ade上对地图的改善率约为30.4%。代码和培训模型可在http://github.com/chanyn/hkrm中找到

 

 

posted @ 2019-07-09 16:46  大头swag  阅读(679)  评论(1)    收藏  举报