基于 YOLOv8 的农作物识别系统数据增强策略对比研究

7445260d04b8eb041ba56ca91b0c47d5c84f6c29

引言

在农田场景目标检测任务中,光照条件多变、目标形态差异大、背景复杂多样是制约模型泛化能力的核心因素。数据增强作为提升模型鲁棒性、缓解过拟合的核心手段,其策略选择直接影响最终检测性能。

当前通用数据增强策略在工业检测、人脸识别等场景已被广泛验证,但针对农作物与杂草细粒度识别场景的适配效果缺乏系统的量化对比。本文基于自主构建的 11 类农田目标数据集,通过控制变量实验,对比分析 6 种主流增强策略对 YOLOv8 检测性能的影响,筛选出适配农业场景的最优增强组合方案,为同类项目提供参考。

一、实验设置

1. 数据集说明

实验采用自主构建的农田场景数据集,涵盖蓝草、藜、刺儿菜、玉米、莎草、棉花、龙葵、番茄、鸭跖草、莴苣、萝卜共 11 个类别,总计 2750 张图像。
数据均采集自真实田间环境,覆盖不同生长期、不同光照强度、不同天气条件及不同程度遮挡的场景,保证样本多样性。数据集按 8:1.6:0.4 比例随机划分为训练集、验证集与测试集。

2. 基线模型与训练参数

实验以 YOLOv8m 为基线模型,统一训练参数如下:

  • 输入图像尺寸:640×640

  • 训练轮次:200 epochs

  • 批次大小:batch=8

  • 优化器:SGD,初始学习率 0.01,动量 0.937

  • 学习率调度:余弦退火策略,3 轮线性热身

  • 评价指标:mAP@0.5、mAP@0.5:0.95、精确率、召回率、F1 分数

所有实验仅调整数据增强策略,其余参数完全一致,确保对比结果的公平性。

二、待对比增强方案设计

选取目标检测领域 6 种主流增强策略,进行单变量对照实验:

  1. Mosaic 增强:将 4 张图像随机裁剪拼接为一张,丰富目标尺度与背景多样性,提升小目标检测能力,设置启用概率为 1.0。

  2. 随机水平翻转:以 0.5 概率对图像进行水平翻转,模拟不同拍摄方向的目标形态。

  3. HSV 色域增强:对图像色相、饱和度、明度进行随机扰动,模拟不同光照条件下的视觉差异。

  4. 随机平移与缩放:随机平移 ±10%、缩放 ±50%,模拟不同拍摄距离与目标位置变化。

  5. RandAugment:自动化组合增强策略,随机选取多种图像变换组合,提升模型泛化性。

  6. MixUp 增强:将两张图像按权重混合叠加,提升模型对模糊边界的判别能力。

三、对比实验结果与分析

在统一测试集上对 7 组模型(1 组基线 + 6 组单增强)进行性能测试,结果如下:

增强策略 mAP@0.5 mAP@0.5:0.95 精确率 召回率
无增强(基线) 0.902 0.813 0.895 0.872
Mosaic 增强 0.941 0.865 0.932 0.910
随机水平翻转 0.915 0.827 0.904 0.885
HSV 色域增强 0.928 0.842 0.921 0.897
随机平移缩放 0.921 0.836 0.913 0.891
RandAugment 0.935 0.854 0.927 0.905
MixUp 增强 0.918 0.831 0.908 0.889

结果分析

  1. Mosaic 增强增益最显著:相比基线模型,mAP@0.5 提升 3.9 个百分点,有效丰富了目标尺度分布与背景复杂度,显著缓解农田场景下目标尺度单一、背景同质化的问题。

  2. 色域增强适配性强:HSV 色域增强对光照变化的鲁棒性提升明显,适配田间从正午强光到傍晚弱光的复杂光照条件,对逆光、阴影场景的识别精度提升显著。

  3. MixUp 增益有限:在农作物细粒度检测场景下,MixUp 带来的性能提升较弱,原因是草本植物目标边界本身模糊,图像混合反而增加了特征学习的难度。

  4. 几何变换类增强效果中等:随机翻转、平移缩放均有一定增益,但提升幅度低于 Mosaic 与色域增强,主要作用是提升目标位置变化的适应性。

四、最优组合方案与实现

在单增强实验基础上,选取增益最高的三种策略进行组合:Mosaic 增强 + HSV 色域增强 + 随机水平翻转。
组合训练后模型在测试集上 mAP@0.5 达到 0.957,mAP@0.5:0.95 达到 0.888,相比基线模型提升 5.5 个百分点,为所有组合中的最优方案。

核心训练配置代码如下:

from ultralytics import YOLO

# 加载YOLOv8m预训练基线模型
model = YOLO("models/yolov8m.pt")

if __name__ == '__main__':
    results = model.train(
        data='datasets/CropData/data.yaml',
        epochs=200,
        batch=8,
        imgsz=640,
        # 数据增强参数配置
        mosaic=1.0,       # 启用Mosaic增强
        hsv_h=0.015,     # 色相扰动范围
        hsv_s=0.7,       # 饱和度扰动范围
        hsv_v=0.4,       # 明度扰动范围
        fliplr=0.5,      # 水平翻转概率
        translate=0.1,   # 平移比例
        scale=0.5,       # 缩放比例
        optimizer='SGD',
        lr0=0.01,
        cos_lr=True,
        workers=4
    )

五、泛化性验证

为验证组合增强方案的实际泛化能力,额外构建包含极端光照、重度遮挡、模糊场景的难例测试集(100 张样本)进行验证。
结果显示,采用组合增强的模型在难例集上 mAP@0.5 达 0.823,相比基线模型的 0.716 提升 10.7 个百分点,证明该增强组合能显著提升模型在复杂田间场景下的鲁棒性,具备更高的实际应用价值。

六、总结与选型建议

  1. 在农作物与杂草识别场景下,Mosaic + HSV 色域增强 + 随机水平翻转是综合性价比最高的增强组合,可同时提升检测精度与场景泛化能力。

  2. 若算力与训练时间有限,可优先启用 Mosaic 与 HSV 增强,以较小的计算成本获得大部分性能收益。

  3. MixUp 增强在草本植物细粒度检测场景收益有限,不建议作为优先启用的策略。

  4. 针对玉米、莎草等识别难度较高的类别,可进一步补充困难样本与针对性增强,进一步提升弱势类别性能。

完整训练过程与效果演示可参考 B 站 兵慌码乱 对应内容。

posted @ 2026-07-03 09:54  兵慌码乱  阅读(5)  评论(0)    收藏  举报