0902 每日文献阅读 打卡

 

 

Read Data: 0902

Publication: CVPR 2021

Title: Generalized Focal Loss V2: Learning Reliable Localization Quality Estimation

for Dense Object Detection

Aim:

从一种全新的、不同于以往的视角,探索用基于边界框的四个参数的分布来预测LQE。

Research Question:

稠密预测的关键是LQE问题。许多前人的研究都对LQE进行了探索,一般来说,上述方法都是基于单纯的卷积特征。与以往的工作不同,本文探索了一个全新的视角,直接利用边界框分布的统计,而不是单纯的卷积特征来进行LQE。

Method:

与以往的工作不同,本文探索了一个全新的视角,直接利用边界框分布的统计,而不是单纯的卷积特征来进行LQE。这里的边界框分布是GFLV1的一般分布,学习每个预测边缘的离散概率分布来描述边界框回归的不确定性。边界框分布的形状(平整度)可以清楚地反映预测结果的定位质量,分布越尖锐,预测的边界框越准确,反之亦然。因此,它可能更容易和非常有效地通过分布信息的引导来更好的LQE,因为输入(边框分布统计)和输出(LQE分数)是高度相关的。受分布统计与LQE得分之间的强相关性的启发,我们提出了一个只有几十个(例如64个)隐藏单元的非常轻量级的子网络,在这些分布统计的基础上产生可靠的LQE分数,显著提高了检测性能。重要的是,它在实际应用中所带来的额外计算量可以忽略不计,而且几乎不影响基本目标检测器的训练/推理速度。在本文中,我们将这种轻量级子网络称为分布导向的质量预测器(DGQP),因为它依赖于分布统计的指导来进行质量预测。通过引入轻量级的DGQP,通过统计边界框分布预测可靠的LQE分数,我们开发了一种基于GFLV1框架的新型密集物体检测器,即GFLV2。

Results:

大量的实验证明了该方法的有效性。值得注意的是,GFLV2 (ResNet101)在14.6 FPS时达到46.2 AP,在COCO test-dev上以绝对2.6 AP超过了之前最先进的ATSS基线(14.6 FPS时的43.6 AP),同时不牺牲训练和推理的效率。

Discussion:

Conclusion:

在本文中,建议学习可靠的定位质量估计,通过统计边界框分布的指导。从一个全新的、完全不同的视角,在概念上也是有效的,因为分布的信息与真实的定位质量高度相关。在此基础上,我们开发了一个密集目标检测器,即GFLV2。对COCO数据集进行了大量的实验和分析,进一步验证了该算法的有效性、兼容性和有效性。我们希望GFLV2可以作为社区简单而有效的基线。

Further:

 

Ref:

 

posted on 2021-09-02 10:35  Lf&x&my  阅读(78)  评论(0)    收藏  举报