PP-YOLO深度解析##
PP - YOLO优化策略详解及案例分享
前情提要
- YOLOv3检测原理
. 网格: 输出特征图H,W维为网格
. 锚框: 9个锚框,每个尺度3个
. 预测框: 输出特征图C上为预测框信息,5 + class_num - PaddleDetection中的YOLOv3模型
. 丰富的模型库,高精度高性能的YOLOv3模型
. 一键式运行YOLOv3模型,YOLOv3模型配置文件解析
. 集成PaddleSlim压缩能力,高性价比的YOLOv3压缩模型
. 更快更强的PP-YOLO模型
YOLOv3及模型优化
- 精度速度性价比高的YOLO系列模型广泛应用于需求实时检测的业务场景
- YOLOv3推出之后优化模型也被广泛地探索,一段时间里没有精度速度显著优化的模型
- 今年(2020年)上半年YOLOv4模型提出,实时检测的速度上超过了很多两阶段模型的检测效果
![屏幕截图 2025-06-29 180702]()
PP-YOLO简介

PP-YOLO模型结构

目标检测优化方法
- 数据增强
. Image Mixup:混合两张图像像素,提升模型泛化能力
. AutoAugment:自动搜索最优数据增强策略(如旋转、剪切)
. Image Mosaic:拼接多张图像模拟多目标场景 - 数据采样
. OHEM:优先选择难样本进行训练
. Class Aware Sampling:通过统计样本的出现的类别,调整样本权重,来实现采样方法 - 网络结构优化
. 更优Backbone:替换为ResNeXt、EfficientNet等先进主干网络,提升特征提取能力
. Deformable Conv:可变形卷积(DCN)适应物体形变
. Coord Conv:显式加入坐标信息到卷积层
. SPP:空间金字塔池化,融合多尺度特征
. DropBlock:区域级Dropout,增强鲁棒性 - 学习策略
. IoU系列Loss:GIoU/DIoU/CIoU 改进原始IoU,解决重叠度计算缺陷
. IoU Aware:预测框的IoU作为置信度加权项
. Label Smooth:软化one-hot标签,防止过自信
. 调整Loss权重:对不同任务(分类/回归)或类别分配不同权重
Grid Sensitive:YOLO系列中调整中心点预测策略,缓解网格偏移问题 - 训练策略
. 调整超参数:Batch Size/LR/迭代次数调优
. Sync Batch Norm:多GPU同步BN统计量
. EMA:指数移动平均更新模型权重,平滑训练波动 - 后处理
. Soft NMS
. Matris NMS
PP-YOLO精度提升历程

Image Mixup
- 将两张图片重叠起来组成一张。提高了网络对空间扰动的泛化能力,在一定程度上增大了正样本的比例,提升了召回率
![屏幕截图 2025-06-29 233232]()
Label Smooth
- one-hot的硬标签会将输出特征图学习到无穷大,过犹不及,容易过拟合,降低分类精度;小量扰动硬标签,变为软标签
![屏幕截图 2025-06-29 235356]()
Synchronized Batch Norm
- 对于多卡并行的场景,一般框架的batch norm实现为各卡独立统计均值和方法;卡间同步均值和方差,‘增大’了batch size,均值方差更合理,收敛速度和收敛效果更好
![屏幕截图 2025-06-29 235639]()
ResNet-D
- 使每个阶段的下采样block丢失了3/4的信息
![屏幕截图 2025-06-29 235850]()
Deformable Conv(DCN)
- 能否在学习权重的时候同时学习卷积核形状?是ResNet50vd-DCN主干
![屏幕截图 2025-06-30 000018]()
DropBlock
- Dropout是深度学习中常用的减少过拟合,提高网络泛化能力的常用方法,DropBlock每次drop掉一块区域而非零散的点,更适用于“检测连通域”的目标检测任务
![屏幕截图 2025-06-30 000210]()
Exponential Moving Average
- 价值投资中通过计算价值历史波动的指数滑动平均值来衡量价格的走势。模型训练的过程中,对参数进行历史滑动平均来让训练过程更平缓稳定
![屏幕截图 2025-06-30 000343]()








浙公网安备 33010602011771号