0916 每日文献阅读 打卡

|
Read Data: 0916 |
Publication: CVPR 2021 |
||
|
Title: Gliding vertex on the horizontal bounding box for multi-oriented object detection |
|||
|
Aim: 提出了一个简单而有效的框架来检测多方向目标。 |
Research Question: 普通的水平边界框表示并不适用于有方向目标,如航拍图像和场景文本中的目标。 避免面向对象的顺序标签点的混淆问题。 使用“旋转四边形”的方法对角度控制的要求很高;或者通过对点分组、集聚等过程,耗时比较长。 |
||
|
Method: 我们提出了一个简单而有效的框架来检测多面向对象。而不是直接回归四个顶点,我们滑动水平边界框的顶点在每个相应的边,以准确地描述一个多方向的对象。具体来说,我们回归四个长度比,表征相对滑动偏移在每个相应的边。这可能有助于偏移学习,并避免面向对象的顺序标签点的混淆问题。为了进一步解决近水平目标的混淆问题,我们还引入了一个基于目标与其水平边界盒面积比的倾角因子,指导对每个目标进行水平或方向检测的选择。我们将这五个额外的目标变量添加到更快的R-CNN的回归头部,这需要可忽略的额外计算时间。 文章采用的结构和faster R-CNN大致相同,不同点在于输出除了边界框的四个点以外,还输出了四个代表框的量(1中的a1~a4)以及一个obliquity factor |
|||
|
Results: 实验主要针对了三个方面:航拍图像中的目标检测、长形的文字的检测、鱼眼相机视角下的行人检测 分别使用的数据集: 1. DOTA、HRSC2016 2. MSRA-TD500、MSRA-TD500 3. MW-18Mar 大量实验结果表明,该方法在航测图像中的目标检测、场景文本检测、鱼眼图像中的行人检测等多个多方向目标检测基准上均取得了较好的性能。在没有extra network design的情况下,已经比其他方法更精确且更快。 |
Discussion: |
||
|
Conclusion: 构建了一种具有鲁棒性、快速的多方向目标检测器。它能准确地检测出无处不在的多方向物体,如arial图像中的物体、场景文本和鱼眼图像中的行人。大量的实验表明,该方法在多个基准上优于一些最先进的方法,同时具有更高的效率。 |
Further: 在未来,我们将探索该方法与其他聚焦于特征增强的方法的互补。单级多方向目标检测器也是一个值得开发的方向。 |
||
|
Ref: Idea很好,但是没有代码。 |
|||
浙公网安备 33010602011771号