YOLOv12环境搭建&推理测试

引子

2025年2月18日，YOLOv 12横空出世，我记得上次YOLO发布还是上次（哈哈！）。几个月前YOLOv11发布（感兴趣的童鞋可以移步https://blog.csdn.net/zzq1989_/article/details/143104284?spm=1001.2014.3001.5501），最近如火如荼的deepseek，我也写了几篇博客，但作为一个CV出身的程序猿，上篇文章也说到，也许追YOLO也成为一个CVer的信仰了吧。OK，那就让我们开始吧。

一、模型介绍

这篇论文围绕实时目标检测，在网络架构设计上引入创新，克服了传统注意力机制在实时应用中的速度瓶颈，提升了检测性能。

（1）构建注意力中心框架

突破传统 YOLO 依赖 CNN 架构的局限，以注意力机制为核心设计 YOLOv12 框架，发挥注意力机制强大的建模能力，打破 CNN 模型在 YOLO 系列中的主导地位。

（2）高效的区域注意力模块

提出简单有效的区域注意力模块（A2），通过简单的特征图划分方式，在减少注意力计算复杂度的同时，保持较大的感受野，显著提升计算速度，且对性能影响较小。

（3）残差高效层聚合网络

引入 R-ELAN 解决注意力机制带来的优化挑战。通过块级残差设计和重新设计的特征聚合方法，增强特征聚合能力，降低模型计算成本和参数 / 内存使用，保证大模型稳定训练。

（4）优化基础注意力机制

对基础注意力机制进行多项改进，如调整 MLP 比例、采用卷积算子、去除位置编码并引入大的可分离卷积感知位置信息等，使模型更适配 YOLO 系统的实时性要求，提升综合性能

二、环境安装

代码仓库

git clone https://github.com/ultralytics/ultralytics.git

环境安装

docker run --rm -it --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel bash

cd /workspace/YOLOv12/ultralytics-8.3.78

pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install onnx -i https://pypi.tuna.tsinghua.edu.cn/simple

三、测试推理

（1）训练

yolo detect train data=coco.yaml model=yolov10n/s/m/b/l/x.yaml epochs=500 batch=256 imgsz=640 device=0,1,2,3,4,5,6,7

（2）评估

yolo val model=yolov12n/s/m/b/l/x.pt data=coco.yaml batch=256

（3）推理

模型下载

yolo predict model=models/yolo12n.pt source='bus.jpg'

posted @ 2025-03-03 09:28 要养家的程序猿阅读(993) 评论(0) 收藏举报

刷新页面返回顶部