PP-YOLO优化策略详解

Large Batch Size

屏幕截图 2025-06-30 175210

IOU Loss

  • 优化点
    . IOU检测框定位精度标准;所见即所得,将-IoU加入loss全家桶
    屏幕截图 2025-06-30 180601

IOU Aware

  • 准确的检测框score不高,反而被NMS滤除,score=objectness*classification,将定位精度指标加入score中
    屏幕截图 2025-06-30 210401

Gird Sensitive

  • 真实框中心坐标落在网格边缘时,会倾向于向将logits加负无穷或正无穷(同label smooth)
  • YOLOv4作者中引入Gird Sensitive,计算中心坐标是,加上一个偏移和缩放
    屏幕截图 2025-06-30 214231

Matrix NMS

  • Soft NMS是直接抑制->惩罚系数。NMS直接抑制了分数低的预测框,对于靠近的同类别物体会出现误抑制的情况
    屏幕截图 2025-06-30 214848
  • Matrix NMS是并行计算优化速度
    屏幕截图 2025-06-30 214903
    屏幕截图 2025-06-30 220008

Coord Conv

  • 卷积只感知卷积核对应的感受野,同时感知全局坐标;增加两个通道,传入x,y坐标信息。
  • 效果:预测速度影响较小(74.8->4.1 FPS),精度提升0.5(43.5->44.0)
    屏幕截图 2025-06-30 221219

SPP

  • 不同尺度的池化窗口提取特征,见小也见大
  • 效果:预测速度影响较小(74.1->72.9 FPS),精度提升0.3(44.0->44.3)
    屏幕截图 2025-06-30 221335

SSLD

  • 具有更有的backbone提取特征,PaddleClas发布的SSLD知识蒸馏模型,各模型在ImageNet上分类精度普遍提升>=3%
  • 效果:预测速度不变(74.192.9FPS),精度提升0.5(44.0->44.8)
    屏幕截图 2025-06-30 222853
posted @ 2025-06-30 22:45  探索笋  阅读(18)  评论(0)    收藏  举报