YOLOv12环境搭建&推理测试
引子
2025年2月18日,YOLOv 12横空出世,我记得上次YOLO发布还是上次(哈哈!)。几个月前YOLOv11发布(感兴趣的童鞋可以移步https://blog.csdn.net/zzq1989_/article/details/143104284?spm=1001.2014.3001.5501),最近如火如荼的deepseek,我也写了几篇博客,但作为一个CV出身的程序猿,上篇文章也说到,也许追YOLO也成为一个CVer的信仰了吧。OK,那就让我们开始吧。
一、模型介绍

这篇论文围绕实时目标检测,在网络架构设计上引入创新,克服了传统注意力机制在实时应用中的速度瓶颈,提升了检测性能。
(1)构建注意力中心框架
突破传统 YOLO 依赖 CNN 架构的局限,以注意力机制为核心设计 YOLOv12 框架,发挥注意力机制强大的建模能力,打破 CNN 模型在 YOLO 系列中的主导地位。
(2)高效的区域注意力模块
提出简单有效的区域注意力模块(A2),通过简单的特征图划分方式,在减少注意力计算复杂度的同时,保持较大的感受野,显著提升计算速度,且对性能影响较小。
(3)残差高效层聚合网络
引入 R-ELAN 解决注意力机制带来的优化挑战。通过块级残差设计和重新设计的特征聚合方法,增强特征聚合能力,降低模型计算成本和参数 / 内存使用,保证大模型稳定训练。
(4)优化基础注意力机制
对基础注意力机制进行多项改进,如调整 MLP 比例、采用卷积算子、去除位置编码并引入大的可分离卷积感知位置信息等,使模型更适配 YOLO 系统的实时性要求,提升综合性能
二、环境安装
代码仓库
环境安装
docker run --rm -it --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel bash
cd /workspace/YOLOv12/ultralytics-8.3.78
pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install onnx -i https://pypi.tuna.tsinghua.edu.cn/simple
三、测试推理
(1)训练
yolo detect train data=coco.yaml model=yolov10n/s/m/b/l/x.yaml epochs=500 batch=256 imgsz=640 device=0,1,2,3,4,5,6,7
(2)评估
yolo val model=yolov12n/s/m/b/l/x.pt data=coco.yaml batch=256
(3)推理
模型下载
yolo predict model=models/yolo12n.pt source='bus.jpg'



浙公网安备 33010602011771号