部署yolo及ORC训练环境记录(一)

我计划使用yolov11+ORC对卡牌牌面中的关键文本信息进行识别。这些文本信息是当前卡牌的唯一标识,可以清楚的说明卡牌的系列、文字、语言、稀有度等。

根据搜索结果,我计划使用Yolov11对卡牌中的文本区域进行提取识别,然后进一步在识别区域使用ORC进行文本识别,最终提取出准确的文字信息。

首先我需要在我的计算机上部署相关的环境。本文主要是记录我的部署过程。
个别过程我没有进行截图保存,所以主要以文字形式进行记录。

  1. 硬件条件
    R7000P 联想拯救者笔记本电脑 2025
    CPU:i9-14900HX
    内存:32G
    GPU:NVIDIA GeForce RTX 5070 Laptop GPU
    硬盘:1TSSD+1TSSD

2.软件条件
操作系统:windows10 专业版 22H2
cuda版本:cuda 13.1
python版本:(已安装)3.7/3.13

3.环境部署过程
3.1 安装Anaconda
3.1.1 下载地址
https://www.anaconda.com/download 该网站需要使用邮箱注册后方可下载,注册并不复杂,使用国内邮箱即可。
image
选择Anaconda Distribution发行版即可。
3.1.2 安装
安装过程与其他软件安装类似,可以不安装到C盘。详细过程可参考:保姆级:安装Anaconda最详细的教程(及Anaconda安装影响了原Python工程怎么办?)

3.2 安装python IDE
python IDE我使用的是Trae,这是我使用的第一个AI IDE,目前观感良好,不过使用时间也不长,还需观察。可以使用其他的IDE,如PyCharm等。

3.3 YOLOv11深度学习环境配置
3.3.1 创建虚拟环境
什么是虚拟环境?
Anaconda Prompt中的虚拟环境是一种独立、隔离的Python运行环境,它允许您在同一台计算机上为不同的项目创建和管理多个独立的Python环境。每个虚拟环境都可以拥有自己的Python解释器版本、第三方库及其特定版本,而不会与其他环境或系统全局的Python环境产生冲突。
虚拟环境的核心概念与作用
项目隔离与依赖管理:想象您的电脑是一个大厨房,Python是锅(环境)。默认情况下,所有项目(菜)都用同一口锅,容易“串味”。例如,项目A需要库的1.0版本,项目B需要2.0版本,混在一起会导致冲突甚至程序崩溃。虚拟环境相当于为每个项目单独准备一口新锅,实现了项目间的完全隔离。这使您能够精确管理每个项目的依赖项,确保项目在任何环境下都能正常运行。
避免全局污染与提升可移植性:使用虚拟环境可以避免将项目特定的库安装到系统全局Python中,从而保持系统环境的干净。当您需要重装系统、更换电脑或与他人共享项目时,可以直接复制或通过配置文件(如requirements.txt)重建虚拟环境,极大地保证了环境的一致性和项目的可移植性。
支持多版本Python与实验学习:虚拟环境允许您在同一台机器上同时运行不同版本的Python(如Python 3.8和3.11),这对于维护遗留项目或测试新版本兼容性至关重要。同时,它也为学习和实验提供了安全沙箱,您可以随意尝试新库或不同版本组合,出现问题只需删除并重建环境即可,不影响其他项目。

创建虚拟环境:
(1)打开 Anaconda Prompt。
(2)输入以下命令创建一个名为yolov11、Python版本为3.11的虚拟环境(Python 3.11被广泛认为是与当前深度学习生态兼容性最稳定的版本之一):
点击查看代码
conda create -n yolov11 python=3.11 -y
(3)创建完成后,激活该环境:
点击查看代码
conda activate yolov11
请注意,以后每次使用YOLOv11项目前,都需要先打开Anaconda Prompt并激活此环境。之后的安装都在该虚拟环境下执行。

3.3.2 安装PyTorch(GPU版本)
在进一步在虚拟环境中部署环境之前,我需要明确一下要安装的PyTorch的版本。使用nvidia-smi指令,我获取了自己的cuda版本为13.1。我查询了pytorch官网,其最新的windows系统下最高支持到cuda13.0,版本为2.10.0。使用以下指令安装PyTorch。

点击查看代码
pip install torch==2.10.0 torchvision torchaudio --index-url https://download.pytorch.org/whl/cu130

3.3.3 安装YOLOv11
使用以下指令安装YOLOv11核心库

点击查看代码
pip install ultralytics

为了提升下载速度,可以使用国内镜像源,例如清华大学镜像源(我没有试过)

点击查看代码
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple ultralytics

获取YOLOv11源码与预训练模型
虽然通过 pip install ultralytics 已经可以调用YOLO模型进行训练和推理,但为了更灵活地进行自定义训练和查看示例代码,建议下载官方源码。
下载源码:您可以通过Git克隆官方仓库,或直接从GitHub下载ZIP压缩包并解压

点击查看代码
git clone https://github.com/ultralytics/ultralytics.git
cd ultralytics

3.3.4 简单验证测试
完成以上步骤后,可以运行一个简单的推理测试来确认整个环境工作正常。在环境中输入python运行python解释器,执行以下代码:

点击查看代码
from ultralytics import YOLO

# 加载一个预训练模型(确保yolov11n.pt文件在可访问的路径)
model = YOLO("yolov11n.pt")

# 对示例图片进行推理
results = model.predict("ultralytics/assets/bus.jpg", save=True)
print("推理完成!结果保存在 runs/detect/predict 目录下。")

运行此脚本,如果能够成功完成推理并保存结果,则证明您的YOLOv11训练环境已完全部署成功。
bus

posted @ 2026-02-03 14:36  cheng6336  阅读(4)  评论(0)    收藏  举报