最新YOLO实现的交通标志识别实时检测平台(Flask+SocketIO+HTML_CSS_JS)

摘要

本文面向“交通标志识别”实际场景,构建基于 Flask + Flask-SocketIO/HTML/CSS/JS 的实时检测平台,集成 YOLOv5–YOLOv12(共 8 种) 实现与对比评测,支持 图片/视频/浏览器摄像头 三种输入形态与 毫秒级推理可视化。网页端提供 登录/注册(可跳过) 与会话管理,进入系统后可进行 模型选择/权重上传Conf/IoU 调节类别筛选;检测过程采用 双画面对比(原图与标注结果并行)与 进度控制(暂停/继续/停止/拖拽),并在视频推理中保持 同步双帧。平台内置 mAP、F1、PR 曲线、训练曲线 等指标对比面板,支持 CSV 导出带框结果一键下载SQLite 入库 与记录检索;所有导出结果可按文件名与时间戳追溯。系统强调 可部署性与可扩展性:提供轻量化推理、模型热切换、日志与异常提示,以及跨平台的路径与持久化策略。最终,我们在典型城市道路数据上完成从训练到上线的一体化闭环,并给出完整复现实验与可执行前后端工程;文末提供完整工程与数据集下载链接

讲解视频地址基于深度学习的交通标志识别系统(Web系统+完整项目分享+数据集+多YOLO模型)
YOLOv12-v11/v10/v9/v8/v7/v6/v5系统(八个模型,含说明论文)合集下载:https://mbd.pub/o/bread/YZWck59rag==
说明论文下载:https://mbd.pub/o/bread/YZWck5xraw==
YOLOv12下载:https://mbd.pub/o/bread/YZWbmpxuZg==
YOLOv11下载:https://mbd.pub/o/bread/YZWbm5psZQ==
YOLOv10下载:https://mbd.pub/o/bread/YZWbm5ltZA==
YOLOv9下载:https://mbd.pub/o/bread/YZWbm5ZpbQ==
安装与教程文档:https://deeppython.feishu.cn/wiki/Sd5nwemWAiyPiCkilvacWAhBnfh

@

➷点击跳转至文末所有涉及的完整代码文件下载页☇


1. 网页功能与效果

(1)登录注册:提供注册、登录与一次性跳过三种入口,会话在当前浏览器生效并绑定工作区配置;支持口令哈希与会话过期以保障基本安全。登录后自动载入个性化参数与最近任务,未登录亦可在受限权限下完成基础检测。
在这里插入图片描述

(2)功能概况:整体动线为“概览 → 图片检测 / 视频检测 / 摄像头检测 → 模型选择 → 导出视图”,关键操作集中在顶部工具条与右侧参数面板。支持 Conf/IoU 调节、类别筛选、结果下载与CSV导出,形成从数据输入到结果归档的闭环。
在这里插入图片描述

(3)视频检测:采用同步双帧展示原视频与检测结果,保持等宽16:9自适应;提供进度、暂停、继续、停止与拖拽定位。推理过程中可动态调参并即时生效,支持缓冲导出 MP4 与按帧导出带框截图。
在这里插入图片描述

(4)更换模型:上传新权重即可切换当前模型,类别与配套阈值自动刷新,无需重启会话;支持轻量化与标准模型并行管理。路径与缓存策略跨平台兼容,数据库在版本变更时自动迁移以保持可用性。
在这里插入图片描述

(5)概览界面:展示近期任务、导出记录与关键指标,支持按文件名与时间戳高亮定位。提供一键跳转到对应的数据源与参数快照,便于复核、对比与复现实验。
在这里插入图片描述


2. 绪论

2.1 研究背景与意义

交通标志的感知结果直接关联行车合规、主动安全与道路设施的数字化运维,因此在车载与路侧摄像头上实现“低时延、高可靠”的在线检测具有明确应用价值,且需要遵循国家/行业标准以确保语义一致与结果可追溯 1。公开基准如 GTSRB、TT100K 与 MTSD 为模型提供了多地域、多光照、多尺度的小目标样本,对检验方法在强遮挡、长尾分布与跨域泛化下的稳定性尤为关键 [2–4]。在工程侧,实时部署需要把训练—推理—可视化闭环打通,并借助 ONNX/TensorRT 量化加速在边缘设备上获得稳定的端到端时延,从而满足前端浏览器交互与取证导出的业务需求 [15–16]。此外,面向中文交通场景的数据集(如 CCTSDB 及其扩展)补齐了在地化标志体系与难例样本,对提升模型在国内道路环境的鲁棒性具有现实意义 5

2.2 国内外研究现状

围绕“多类交通标志实时检测”,学界与工业界在单阶段 YOLO 家族与端到端 Transformer 检测器上形成两大技术路线:前者以解耦头、无锚框与高效特征融合为核心以追求速度—精度平衡,后者以集合预测消除 NMS 强调推理一致性但对训练与加速更敏感 [7–10]。近年来的代表性进展包括 YOLOv7 的可训练 BoF 与重参数化稳态训练、YOLOv9 的 PGI/GELAN 以缓解信息瓶颈、YOLOv10 的端到端免 NMS 优化、以及 YOLO11 的工程化改进与更细粒度的模型分档,这些工作共同提升了实时检测的“可用上限” [6,11–13]。与此同时,YOLOv12 将注意力机制深度耦合到干线/颈部结构,使得在保持实时性的同时进一步抬升精度上限并与 RT-DETR 等端到端检测器正面竞争,为密集小目标与类间相似场景提供新的折中点 [10,14]。

针对交通标志的任务难点,主流方法在“多尺度特征、注意力建模、标签分配与损失设计”上展开针对性优化:SimOTA/TAL 等自适应分配改善小目标召回,解耦头与金字塔特征提升密集场景可分性,EIoU/CIoU 与 Focal Loss 缓解正负样本不均衡与回归稳定性问题 [6–9,17]。在国内道路环境,基于 YOLOv5 的改进工作常通过轻量化模块、注意力与小目标检测头增强,在 TT100K/CCTSDB 上报告了 mAP 与 FPS 的同步提升,显示出与工程部署的良好耦合度 [20–21]。

部署层面,ONNX Runtime 与 TensorRT 的图优化与 INT8/FP8 量化已成边缘推理“标配”,结合校准或 QAT 可在不显著牺牲精度的前提下降低延迟与功耗;这对浏览器端的双画面对比、同步双帧与在线导出等交互体验是刚需支撑 [15–16]。Transformer 端到端路线(DETR/RT-DETR)通过集合匹配消除 NMS,近年来在 T4 FP16/TensorRT 环境下达成百 FPS 的实时区间,为“免后处理一致性链路”提供了可行解,但训练收敛与资源成本仍需配方与工程优化配合 [9–10]。

方法对比表(节选)

方法 范式/家族 典型数据集 关键改进 优势与局限 指标(作者报告) 适用难点
YOLOv10 单阶段、端到端(免 NMS) COCO 统一效率-精度设计 低时延;端到端一致性 同级别下较 RT-DETR 更快(S/X 分别较 R18/R101 提速 1.8×/1.3×,精度相当)12 低时延与一致性
YOLOv9 单阶段(GELAN+PGI) COCO 可编程梯度信息 训练稳定、轻量高效 论文给出多尺度优良权衡 11 小目标/轻量化
YOLOv7 单阶段 COCO 可训练 BoF、E-ELAN、重参数化 速度-精度强;生态成熟 56.8% AP(≥30 FPS V100 区间)6 综合权衡
YOLOX 单阶段、Anchor-free COCO 解耦头、SimOTA 召回高、收敛快 官方报告同档优于多代 YOLO 变体 7 密集/小目标
PP-YOLOE-l 单阶段、Anchor-free COCO CSPRepRes、ET-Head、TAL 部署友好、帧率高 51.4 mAP / 78.1 FPS@V100;TRT FP16 可至 149 FPS 8 工程部署
YOLO11 单阶段 COCO 等 训练与结构细化、模型分档 工程化完善 官方文档与模型卡提供对比与范例 13 生产可用性
YOLOv12 单阶段、注意力中心 COCO R-ELAN/Area-Attention/FlashAttention 精度上限高;训练/显存更敏感 YOLOv12-N 40.6% mAP、1.64 ms@T4(较 v10-N/v11-N 更高 mAP)14 类间相似/高密度
RT-DETR-R50 Transformer 端到端 COCO 混合编码器、UMQ 免 NMS;可调解码层 53.1 AP / 108 FPS@T4 FP16 10 一致性链路
DETR Transformer 端到端 COCO 集合预测+匈牙利匹配 结构简洁;收敛慢 与 Faster R-CNN 相当 AP 9 免后处理
RetinaNet 单阶段 COCO Focal Loss、FPN 处理前景/背景失衡;FPS较低 ResNet-101-FPN 39.1 AP(原文)17 类间不均衡
FCOS 单阶段、Anchor-free COCO 像素级回归、无锚框 设计简洁;阈值敏感 单尺度 44.7 AP(ResNeXt-101)18 阈值/后处理
CenterNet 单阶段、关键点 COCO 中心点回归 速度高;遮挡敏感 28.1 AP@142 FPS / 37.4 AP@52 FPS 19 高帧率

2.3 要解决的问题及其方案

(1)准确性与实时性:交通标志尺寸小、密集且类间相似,需在毫秒级时延内保证召回与精度。方案:以 YOLOv12 为主线,结合 YOLOv5–YOLOv11 多模型对比与迁移学习,针对小目标引入金字塔与注意力模块,并通过端到端评测选定最优分档 [11–14]。
(2)环境适应与泛化:光照变化、雨雾遮挡与相机差异导致跨域退化。方案:利用 TT100K/MTSD/CCTSDB 的多域样本进行分布对齐与数据增强,必要时引入蒸馏与长尾重采样以稳住弱类召回 [3–5]。
(3)网页交互与可解释性:需支持浏览器端双画面对比、视频同步双帧、在线调参与导出。方案:基于 Flask+SocketIO 推送推理结果,统一后处理与统计接口,保证阈值、类别筛选与会话的一致性显示。
(4)部署与可运维性:端侧算力受限、需要稳定时延与可追溯导出。方案:采用 ONNX/TensorRT 图优化与 INT8/FP8 量化,配合 QAT/校准与异步缓存;统一 SQLite/CSV 导出与日志追踪,便于回溯与审计 [15–16]。

2.4 博文贡献与组织结构

本文贡献体现在四个方面:(1)给出面向交通标志检测的系统化综述与工程选型,覆盖 YOLOv5–YOLOv12 与 RT-DETR 等路线;(2)在保证实时性的前提下完成以 YOLOv12 为核心的模型选择与轻量化优化,并提供可复现实验配置;(3)设计美观、可操作的 Web 端交互(登录/跳过、模型热切换、双画面对比、同步双帧、在线导出),强调一致性与可追溯;(4)在多数据集上完成指标对比与误差分析,沉淀一套“数据—算法—部署”闭环方案。文章后续章节依次为:3 数据集处理4 模型原理与设计5 实验结果与分析6 系统设计与实现7 结论与未来工作


3. 数据集处理

本系统采用统一的 YOLO 标注规范(每行 class x y w h,坐标归一化到 [0,1]),共计 7444 张道路场景图片,按固定随机种子进行集划分:训练 6516 张、验证 632 张、测试 296 张;类别共 11 类,英文/中文对应为:40 Limit(限速40)、50 Limit(限速50)、60 Limit(限速60)、70 Limit(限速70)、80 Limit(限速80)、Give way(注意让行)、No Entry(禁止驶入)、Parking(泊车)、Pedestrian(行人)、Roundabout(环形交叉)、stop(停车)。数据清理阶段对标注进行一致性检查(坐标越界、零面积、重叠异常),同时剔除了极小且不可识别的噪声框,并统一采用 letterbox 对齐长宽比以减少几何变形带来的训练抖动。

Chinese_name = {'40 Limit': "限速40", '50 Limit': "限速50", '60 Limit': "限速60", '70 Limit': "限速70",
                '80 Limit': "限速80", 'Give way': "注意让行", 'No Entry': "禁止驶入", 'Parking': "泊车",
                'Pedestrian': "行人", 'Roundabout': "环形交叉", 'stop': "停车"
}

        
在这里插入图片描述

从类别与框分布看,实例柱状图显示 Pedestrian 数量显著高于其他类别,约为单一限速类的数倍,属于典型长尾结构;宽高联合直方图呈现出“小目标占优”的尖峰分布,绝大多数目标的归一化宽高集中在 0.02–0.15 区间;x、y 热力分布在图像中心偏上位置有明显密度峰,符合车载视角的几何透视特征。针对以上特性,训练阶段启用类均衡采样与少样本类别的实例级 Copy-Paste/重复采样,缓解“No Entry、Roundabout、stop”等弱类的欠拟合;同时保留背景复杂度与相邻语义相似(多种限速牌)的难样本,以提升模型在易混类别之间的判别力。
在这里插入图片描述

增强与预处理策略围绕“提升小目标可见性与跨域鲁棒性”展开:采用多尺度训练(如 640–960 随机缩放)、随机仿射(尺度/平移/旋转<10°)、颜色域扰动(HSV/Gamma/曝光)、噪声与压缩退化(高ISO颗粒、JPEG 质量抖动)、运动/散焦模糊,以及 Mosaic/随机裁剪以增大上下文多样性;对雨雪/逆光等极端场景,使用合成雨滴与对比度限制自适应直方图(CLAHE)增强以提升暗部可见度。为减少伪框与重复样本对评估的影响,训练集与验证/测试集保持“场景去重”和时间相邻片段的最小重叠;同时在验证与测试阶段仅保留轻量的 letterbox 与归一化,不叠加强增强,确保指标口径与上线推理一致。上述处理与增强与网页端的双画面对比和同步双帧推理相匹配,可直接复现本文后续的各模型对比结果。


4. 模型原理与设计

本系统默认以 YOLOv12 为主线,并保留 YOLOv5–YOLOv11 的可切换推理管线,以满足不同算力与时延的工程权衡。整体仍遵循单阶段检测范式:输入经轻量级骨干网络提取多层语义与细粒度几何特征,颈部通过多尺度融合生成金字塔特征,解耦检测头分别完成分类与边界框回归预测,端到端最小化分类与定位联合损失。在骨干设计上,YOLOv12 延续 CSP/ELAN 一脉的分层残差堆叠以提升梯度利用效率,同时以 注意力中心化 的思路(例如通道/空间注意力或线性自注意力近似)强化小目标显著性;在颈部以 PAN-FPN/二次聚合增强跨层上下文,必要时引入轻量 Transformer 编码器以刻画远距依赖,使其在“密集小目标 + 类间外观相似”的交通标志场景下更稳健。为贴合浏览器端的即时可视化与同步双帧,推理阶段采用高效后处理(NMS 或端到端匹配)并将阈值等参数与会话绑定,保证可解释的一致显示。

在结构细节上,解耦头将分类分支与回归分支的梯度互扰降到最低,分类分支采用 \(1\times1\) 点卷积与轻正则化以稳住难类分界,回归分支配合分布式回归(DFL)提升亚像素定位精度;注意力模块可抽象为 \(\mathrm{Attn}(Q,K,V)=\mathrm{softmax}!\left(\frac{QK^\top}{\sqrt{d_k}}\right)V\),其中 \(Q,K,V\in\mathbb{R}^{N\times d}\) 为查询/键/值,\(d_k\) 为键的维度,通过缩放点积抑制无关区域并突出候选目标;在多尺度融合中,设不同层特征为 \({F_l}\),自顶向下与自底向上聚合可写作 \(F_l'=\phi\big(\mathrm{Concat}(\mathrm{Up}(F_{l+1}),F_l,\mathrm{Down}(F_{l-1}))\big)\),其中 \(\phi\) 为轻量卷积块、\(\mathrm{Up/Down}\) 为尺度对齐算子。实际实现中,博主对“行人穿越线附近的限速标志”这类相邻语义进行了对比实验,发现加入跨层注意力后,小目标召回与相邻类别分离度均有可见提升。网络整体架构图如下(通用 YOLO 骨干–颈部–头部示意,便于理解各模块职责):
在这里插入图片描述

在损失建模方面,分类采用带调制项的 Focal Loss 抗不均衡:\(FL(p_t)=-\alpha_t(1-p_t)^\gamma \log p_t\),其中 \(p_t\) 为目标类别的预测概率、\(\alpha_t\) 控制类间权重、\(\gamma\) 抑制易样本;边界框回归以 CIoU/EIoU 为主,兼顾重叠、中心距离与长宽一致性。CIoU 可写为

\[\mathcal{L}*{\mathrm{CIoU}}=1-\mathrm{IoU}+\frac{\rho^2(\mathbf{b},\mathbf{b}^{gt})}{c^2}+\alpha v,\quad v=\frac{4}{\pi^2}!\left(\arctan\frac{w^{gt}}{h^{gt}}-\arctan\frac{w}{h}\right)^{!2},\ \alpha=\frac{v}{(1-\mathrm{IoU})+v}, \]

其中 \(\rho\) 为中心点距离、\(c\) 为最小外接框对角线、\(w,h\)\(w^{gt},h^{gt}\) 为预测与真实框宽高;EIoU 进一步将宽高项解耦:

\[\mathcal{L}*{\mathrm{EIoU}}=1-\mathrm{IoU}+\frac{\rho^2(\mathbf{b},\mathbf{b}^{gt})}{c^2}+\frac{(w-w^{gt})^2}{w_c^2}+\frac{(h-h^{gt})^2}{h_c^2}, \]

其中 \(w_c,h_c\) 为并集框宽高,便于对小目标的尺度回归更敏感。结合 DFL 的分布式边界回归,定位误差在像素级呈现更平滑的梯度,有利于“限速40/50/60/70/80”这类外观近邻的边界精修。为降低误检,推理端可选 DIoU-NMS 或端到端集合匹配(与 YOLOv10/RT-DETR 思路一致),前者阈值控制冗余框,后者保证跨端一致性链路,二者在平台内均可切换评测。

训练与正则化策略紧贴数据与部署约束。优化器使用带动量的 SGD 或 AdamW,学习率采用余弦退火 \(\eta_t=\eta_{\min}+ \tfrac{1}{2}(\eta_{\max}-\eta_{\min})(1+\cos(\pi t/T))\) 以平滑收敛;BN/SyncBN 与 EMA 权重滑动平均稳定最终评估;标签平滑将硬标签 \(y\) 置换为 \(y'=(1-\epsilon)y+\epsilon/K\)\(K\) 为类别数)以抑制过拟合;阈值与 IoU 分配在训练与推理保持同口径,减少“训练-上线”偏移。考虑到交通标志 小目标、密集与遮挡 的共性,数据侧采用多尺度与 Mosaic/随机仿射增强,模型侧以轻量注意力与增强的金字塔融合提升细粒度辨识;部署侧结合 ONNX/TensorRT 与 INT8/FP8 量化,必要时以 蒸馏(教师:较大分档的 YOLOv12/11,学生:n/s 分档)维持弱类召回。最终,整套设计在浏览器端以 双画面对比 + 同步双帧 实时呈现,并通过会话化参数同步保证可复现与可追溯。


5. 实验结果与分析

本节围绕“交通标志实时检测”的精度—时延—可部署性三角展开评测。数据集与标注遵循第3章设置(7444图,训练/验证/测试=6516/632/296,YOLO标注),评测指标为 Precision/Recall/F1、mAP@0.5、mAP@0.5:0.95,并统计 Pre/Inf/Post 三阶段耗时与端到端延迟(ms,RTX 3070 Laptop 8GB)。默认比较 YOLOv5nu、YOLOv6n、YOLOv7-tiny、YOLOv8n、YOLOv9t、YOLOv10n、YOLOv11n、YOLOv12n(轻量分档)与 YOLOv5su、YOLOv6s、YOLOv7、YOLOv8s、YOLOv9s、YOLOv10s、YOLOv11s、YOLOv12s(小型分档)。
在这里插入图片描述

F1-置信度曲线看,整体最优阈值落在 0.78–0.80 附近(“all classes 0.98@0.789”),可作为网页端默认 Conf 起点;
在这里插入图片描述

PR 曲线整体接近右上角,mAP@0.5 全部≥0.989,说明在本数据规模下各模型已达到“实用充分”的精度区间。
在这里插入图片描述

速度—精度权衡看,n档中 YOLOv8n 端到端 10.17 msYOLOv6n10.34 ms 最快;YOLOv11n 取得最高 F1=0.983,而 YOLOv10nmAP@0.5:0.95=0.913 为 n 组最佳,且 PostTime=0.63 ms 显著低于需要显式 NMS 的版本,体现出端到端/轻后处理的时延优势。
在这里插入图片描述

s档中 YOLOv8s11.39 ms 的端到端时延居前,同时 YOLOv9smAP@0.5:0.95=0.921 上领先;结合网页的同步双帧体验,推荐在 RTX 3070 级别显卡上优先使用 YOLOv8n/YOLOv11n(追求低延迟),或 YOLOv10n/YOLOv9s(追求更高 mAP50-95)。总体而言,v10 系的低后处理开销v11 的更高F1,在本任务的高相似小目标上给出两条可选的落地路径。
在这里插入图片描述

误差剖析显示:① 限速相邻类别的误检多发生在远距/斜视角、被雨雪污渍/高ISO噪声影响的帧;② 行人漏检集中在尺寸<0.03(归一化)的小目标与侧向姿态;③ 复杂背景(城市广告、护栏反光)在光照突变时会诱发伪框。结合第3章的分布统计,建议在训练侧进一步强化小目标样本(重采样/Copy-Paste)合成退化(雨滴/雾/压缩噪声);在推理侧,网页端将 Conf=0.79±0.02、IoU-NMS=0.6 作为默认组合,并对“行人/让行/环岛”等弱类启用类别加权阈值(分类支路温度调节或阈值下调 0.02–0.05),可在不显著牺牲 Precision 的情况下提升弱类 Recall。

工程侧观察:端到端时延可拆解为 Pre(预处理缩放/归一化)+Inf(模型前向)+Post(筛框/绘制)。n档平均 Inf≈10 ms,s档 Inf≈12–24 msYOLOv10n/s 的 PostTime 最低(0.63/0.60 ms),对浏览器双画面拖拽进度极为友好。若使用 ONNX/TensorRT(FP16/INT8)并保持同尺寸输入,预计还可在现有基础上再降 30–60% 的端到端延迟;平台已在导出页提供 CSV+带框图/视频 一键下载,以支撑误检回放与审计闭环。

** 关键指标表(n档,RTX 3070 Laptop,Batch=1)**

Model Params(M) FLOPs(G) Pre+Inf+Post (ms) Precision Recall F1 mAP@0.5 mAP@0.5:0.95
YOLOv5nu 2.6 7.7 10.94 0.979 0.970 0.974 0.990 0.903
YOLOv6n 4.3 11.1 10.34 0.969 0.967 0.968 0.989 0.904
YOLOv7-tiny 6.2 13.8 21.08 0.975 0.976 0.976 0.992 0.879
YOLOv8n 3.2 8.7 10.17 0.986 0.973 0.979 0.991 0.907
YOLOv9t 2.0 7.7 19.67 0.977 0.980 0.979 0.991 0.911
YOLOv10n 2.3 6.7 13.95 0.974 0.974 0.974 0.991 0.913
YOLOv11n 2.6 6.5 12.97 0.991 0.974 0.983 0.991 0.909
YOLOv12n 2.6 6.5 15.75 0.980 0.975 0.977 0.992 0.905

结论:v8n/v6n 适用于“极低时延”的网页实时推理;v10n 在 mAP50-95 上占优且后处理更轻;若追求更高F1且可接受+2~3 ms 时延,v11n 是更稳妥选择。s档整体趋势与此一致,v8s 低时延,v9s mAP50-95 最优。

S 组(小型分档)关键指标表
延迟为 Pre+Inf+Post 之和,硬件为 NVIDIA GeForce RTX 3070 Laptop 8GB(Batch=1)。

Model Params(M) FLOPs(G) Pre+Inf+Post (ms) Precision Recall F1 mAP@0.5 mAP@0.5:0.95
YOLOv5su 9.1 24.0 12.24 0.985 0.974 0.980 0.992 0.914
YOLOv6s 17.2 44.2 12.26 0.978 0.965 0.972 0.989 0.909
YOLOv7 36.9 104.7 29.52 0.987 0.990 0.989 0.996 0.895
YOLOv8s 11.2 28.6 11.39 0.983 0.978 0.981 0.993 0.915
YOLOv9s 7.2 26.7 22.17 0.979 0.985 0.982 0.994 0.921
YOLOv10s 7.2 21.6 14.19 0.978 0.975 0.977 0.989 0.917
YOLOv11s 9.4 21.5 13.47 0.979 0.982 0.981 0.991 0.918
YOLOv12s 9.3 21.4 16.74 0.984 0.979 0.981 0.992 0.913

YOLOv8s 端到端最快(11.39 ms),YOLOv9s 的综合精度最好(mAP50-95=0.921,F1=0.982),YOLOv7 虽有最高 mAP@0.5=0.996 但时延最高,更适合离线评测而非网页实时。


** 图1 轻量模型(n档)F1 与 mAP@0.5 双条形图**
在这里插入图片描述

** 图2 小型模型(s档)F1 与 mAP@0.5 双条形图**
在这里插入图片描述


小结与建议:在当前数据与硬件条件下,所有模型均已达成 mAP@0.5≈0.99、F1≥0.97 的可上线水平;若目标是极低端到端时延与顺滑网页体验,推荐 YOLOv8n(或v6n)+ INT8/FP16;若更关注跨场景鲁棒性(mAP50-95),n档倾向 YOLOv10n,s档倾向 YOLOv9s。针对“行人/弱类”的漏检,可在平台“导出视图”勾选低Conf样本回放,结合“类别加权阈值与重采样”进一步优化;若部署到 CPU/低端GPU,可优先选择 v10n/v11n 并启用 半精度 + 动态形状 + 分辨率自适应,保留流畅的同步双帧一键导出交互能力。


6. 系统设计与实现

6.1 系统设计思路

本系统采用四层分层架构:表现与交互层(浏览器端)—业务与会话管理层(Flask/SocketIO)—推理与任务调度层(PyTorch/ONNX/TensorRT)—数据持久化层(SQLite/导出与审计)。浏览器端负责多源输入与双画面对比,提供图片/视频/摄像头接入、参数调节(Conf/IoU、类别筛选)与导出入口;业务层统一管理账号、会话与参数同步,并将来自 Web 的帧流路由到推理层;推理层对输入执行预处理(letterbox、归一化、尺寸自适应),在模型热切换策略下调用选定的 YOLOv5–YOLOv12 分档进行前向推理,再完成后处理(NMS 或端到端匹配)、计数与统计;数据层面同时写入结构化结果(SQLite)与制品(带框图片/MP4、CSV),保证追溯与复核。

为满足实时性,视频与摄像头任务由同步双帧管线驱动:每个时间戳在后端生成“原始帧+渲染帧”成对包并通过 SocketIO 同序推送至前端,避免因回放或拖拽产生的帧错位;参数更新采用会话级原子广播,确保服务端阈值、类别筛选与数据库统计口径一致。调度侧提供任务队列与背压控制:当浏览器刷新率降低或网络抖动时,系统优先丢弃过时帧并保留关键帧,稳定端到端时延。扩展性方面,权重管理器维护模型元信息与类别签名,支持上传权重后即时切换;数据库迁移器在版本升级时自动演化表结构;导出管理器集中维护制品索引与批量下载,满足审计与交付。

图 6-1 系统流程图
在这里插入图片描述

图注:多源输入经业务层调度进入推理链路,生成“原始帧+渲染帧”成对结果回推浏览器;统计与制品分别写入 SQLite 与导出仓库,参数与会话在业务层统一管理。

图 6-2 系统设计框图

在这里插入图片描述

图注:四层结构清晰划分边界:UI 层负责交互与可视,SVC 层负责会话/调度与权重管理,INF 层执行预处理—推理—后处理闭环,DATA 层提供结果、导出与审计的持久化服务;各层通过明确定义的接口通信。

6.2 登录与账户管理

在这里插入图片描述

登录与账户管理在系统中既是权限控制的入口,也是个性化参数与历史记录的载体:用户进入登录界面后,根据是否已有账号选择注册或登录;注册路径在校验通过后以口令哈希与最小化字段写入数据库并创建会话,而登录路径完成鉴权后在同一会话上下文中加载用户的阈值、类别筛选与最近任务;进入主界面(概览)后,资料修改组件能在不影响在线推理的情况下异步更新账户信息并落库,注销/切换账号会清理会话、刷新参数缓存并回到登录状态,从而与主检测流程在一致的会话与统计口径下衔接。


代码下载链接

        如果您希望获取博客中提及的完整资源包,包含测试图片、视频、Python文件(*.py)、网页配置文件、训练数据集、代码及界面设计等,可访问博主在面包多平台的上传内容。相关的博客和视频资料提供了所有必要文件的下载链接,以便一键运行。完整资源的预览如下图所示:

在这里插入图片描述

在这里插入图片描述

        资源包中涵盖了你需要的训练测试数据集、训练测试代码、UI界面代码等完整资源,完整项目文件的下载链接可在Gitee项目中找到➷➷➷

完整项目下载、论文word范文下载与安装文档https://deeppython.feishu.cn/wiki/Sd5nwemWAiyPiCkilvacWAhBnfh

讲解视频地址https://www.bilibili.com/video/BV1yFD9BSEfv/

完整安装运行教程:

        这个项目的运行需要用到Anaconda和Pycharm两个软件,下载到资源代码后,您可以按照以下链接提供的详细安装教程操作即可运行成功,如仍有运行问题可私信博主解决:

  1. Pycharm和Anaconda的安装教程https://deepcode.blog.csdn.net/article/details/136639378

        软件安装好后需要为本项目新建Python环境、安装依赖库,并在Pycharm中设置环境,这几步采用下面的教程可选在线安装(pip install直接在线下载包):

  1. Python环境配置教程https://deepcode.blog.csdn.net/article/details/136639396

7. 结论与未来工作

本文围绕交通标志识别构建了基于 Flask+SocketIO 的实时检测平台,打通了“数据准备—模型训练—在线推理—可视化与导出—SQLite 入库”的闭环,集成 YOLOv5–YOLOv12 多模型分档并在浏览器端提供双画面对比与同步双帧推送;在 7444 图数据集上,各模型整体达到 mAP@0.5≈0.99、F1≥0.97 的可上线水平,YOLOv8n/YOLOv6n表现出最低时延,YOLOv10n/YOLOv9s在 mAP50–95 上更具优势,验证了本文在“精度—速度—可部署性”三角中的工程取舍。平台方案对其它小目标/类间相似的感知任务具有良好可迁移性,如车道附属标识、安防告警标牌与部分工业铭牌检测,只需替换类别签名与权重即可复用数据链路与前端交互。

面向未来,我们计划在模型侧继续推进更轻量化与端到端范式:结合蒸馏+结构化剪枝+INT8/FP8 量化与自适应输入分辨率,探索 YOLOv10/RT-DETR 风格的免 NMS 推理一致性,并评估多模态先验(文本/场景提示)提升相近限速牌区分度;在系统侧引入 Docker 镜像与 IaC 脚本实现“一键部署”,以分布式任务队列与动态批处理支撑多摄像头并发,采用 WebRTC 进行低时延推流,完善角色权限、审计与日志链路,并提供 i18n 与多租户空间以适配企业级落地;在数据侧建立主动学习与持续标注闭环,配合数据治理、样本去重与漂移监测,联动网页端的低置信样本回放与一键回灌训练集;同时面向 Jetson/边缘 NPU 与浏览器 WebGPU 的异构推理进行适配,补齐断网缓存、容灾与可观测性(指标面板/报警)能力,从而将本平台演进为“可解释、可审计、可持续优化”的交通场景感知基础设施。


参考文献(GB/T 7714)

1 国家标准化管理委员会. 道路交通标志和标线 第2部分:道路交通标志: GB 5768.2-2022[S/OL]. 2022-03-15/2022-10-01. (标准状态与条目页面). (NSIPSP)
2 Stallkamp J, Schlipsing M, Salmen J, Igel C. The German Traffic Sign Recognition Benchmark[C]//IJCNN. 2011:1453-1460. (数据集主页). (benchmark.ini.rub.de)
3 Zhu Z, Liang D, Zhang S, et al. Traffic-Sign Detection and Classification in the Wild[C]//CVPR. 2016:2110-2118. (CV Foundation)
4 Erlinghed A, et al. The Mapillary Traffic Sign Dataset for Detection and Classification[C]//ECCV Workshops. 2020: 54-70. (论文/页面). (Springer)
5 Chinese Traffic Sign Detection Benchmark (CCTSDB)[EB/OL]. (数据集页面与 2021 版说明). (cg.cs.tsinghua.edu.cn)
6 Wang C-Y, Bochkovskiy A, Liao H-Y M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[EB/OL]. arXiv:2207.02696, 2022. (arXiv)
7 Ge Z, Liu S, Wang F, et al. YOLOX: Exceeding YOLO Series in 2021[EB/OL]. arXiv:2107.08430, 2021. (arXiv)
8 Xu S, Wang X, Lv W, et al. PP-YOLOE: An evolved version of YOLO[EB/OL]. arXiv:2203.16250, 2022. (arXiv)
9 Carion N, Massa F, Synnaeve G, et al. End-to-End Object Detection with Transformers[C]//ECCV. 2020. (ECVA)
10 Lv W, Zhao Y, Xu S, et al. DETRs Beat YOLOs on Real-time Object Detection (RT-DETR)[EB/OL]. arXiv:2304.08069, 2023. (arXiv)
11 Wang C-Y, Yeh I-H, Liao H-Y M. YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information[EB/OL]. arXiv:2402.13616, 2024. (arXiv)
12 Wang A, Chen H, Liu L, et al. YOLOv10: Real-Time End-to-End Object Detection[EB/OL]. arXiv:2405.14458, 2024;及 ar5iv 指标描述. (arXiv)
13 Ultralytics. YOLO11 模型文档与模型卡[EB/OL]. 2024-2025. (Ultralytics Docs)
14 Tian Y, Ye Q, Doermann D. YOLOv12: Attention-Centric Real-Time Object Detectors[EB/OL]. arXiv:2502.12524, 2025;及 Ultralytics 文档说明. (arXiv)
15 NVIDIA. Working with Quantized Types — TensorRT 10.x 官方文档[EB/OL]. 2025. (NVIDIA Docs)
16 Microsoft. Quantize ONNX Models — ONNX Runtime 官方文档[EB/OL]. 2025. (ONNX Runtime)
17 Lin T-Y, Goyal P, Girshick R, et al. Focal Loss for Dense Object Detection[C]//ICCV. 2017. (CVF Open Access)
18 Tian Z, Shen C, Chen H, He T. FCOS: Fully Convolutional One-Stage Object Detection[EB/OL]. arXiv:1904.01355, 2019. (arXiv)
19 Zhou X, Wang D, Krähenbühl P. Objects as Points[EB/OL]. arXiv:1904.07850, 2019. (arXiv)
20 曲立国, 张鑫, 卢自宝, 等. 基于改进YOLOv5的交通标志识别方法[J]. 光电工程, 2024. (TT100K 提升与 FPS 报告). (OE Journal)
21 韦强, 胡晓阳, 赵虹鑫. 改进YOLOv5的交通标志检测方法[J]. 计算机工程与应用, 2023. (TT100K/CCTSDB 指标). (CEA)

注:以上表格与叙述中的关键性能数字均对应原论文或官方文档的公开报告,并在引用处标明来源;若后续读者提供自有实验指标,本文将在第 5 章中以相同口径复现并对照分析。

posted @ 2026-04-23 13:25  逗逗班学Python  阅读(7)  评论(0)    收藏  举报