合集-深度学习
摘要:
本文介绍了一个基于YOLO算法的水下海洋生物识别系统,该系统具有以下特点:1)采用三栏式交互界面,支持图片、视频、摄像头等多种检测模式;2)具备多模型切换功能,内置YOLOv5/v8/v11/v12等模型,其中YOLO12n精度最高(mAP40.6%),YOLO11n速度最快(56.1ms);3)提供完整的数据处理流程,包括1700张图片的数据集、训练可视化及结果导出功能;4)集成用户管理系统,支持注册登录、信息修改等操作。系统通过Python3.10+PyQt5+SQLite技术栈实现,可满足水下生物识别的多样化需求。
阅读全文
本文介绍了一个基于YOLO算法的水下海洋生物识别系统,该系统具有以下特点:1)采用三栏式交互界面,支持图片、视频、摄像头等多种检测模式;2)具备多模型切换功能,内置YOLOv5/v8/v11/v12等模型,其中YOLO12n精度最高(mAP40.6%),YOLO11n速度最快(56.1ms);3)提供完整的数据处理流程,包括1700张图片的数据集、训练可视化及结果导出功能;4)集成用户管理系统,支持注册登录、信息修改等操作。系统通过Python3.10+PyQt5+SQLite技术栈实现,可满足水下生物识别的多样化需求。
阅读全文
摘要:
项目演示视频: 15分钟速通yolo12,从环境搭建到推理图片,最后训练自己的数据集_哔哩哔哩_bilibili 1 环境搭建 1.1 python安装 python我们这里使用了3.10,python的下载地址:Python Release Python 3.10.11 | Python.or
阅读全文
项目演示视频: 15分钟速通yolo12,从环境搭建到推理图片,最后训练自己的数据集_哔哩哔哩_bilibili 1 环境搭建 1.1 python安装 python我们这里使用了3.10,python的下载地址:Python Release Python 3.10.11 | Python.or
阅读全文
摘要:
本文介绍了使用LabelImg工具标注YOLO格式数据集的全流程。首先详细讲解了LabelImg的标注方法,包括创建矩形框、类别命名及标注文件格式说明。然后提供了Python脚本自动划分数据集的方案,支持自定义训练集/验证集/测试集比例,并生成YOLO训练所需的dataset.yaml配置文件。最后展示了基于PyQt5封装的GUI工具,使数据集划分更加可视化、易操作。整个过程从数据标注到预处理完整覆盖,为计算机视觉项目的数据准备提供了便捷的解决方案。
阅读全文
本文介绍了使用LabelImg工具标注YOLO格式数据集的全流程。首先详细讲解了LabelImg的标注方法,包括创建矩形框、类别命名及标注文件格式说明。然后提供了Python脚本自动划分数据集的方案,支持自定义训练集/验证集/测试集比例,并生成YOLO训练所需的dataset.yaml配置文件。最后展示了基于PyQt5封装的GUI工具,使数据集划分更加可视化、易操作。整个过程从数据标注到预处理完整覆盖,为计算机视觉项目的数据准备提供了便捷的解决方案。
阅读全文
摘要:
本期介绍了如何利用MATLAB的Image Labeler工具标注数据并训练RCNN目标检测器(以AlexNet为骨干网络),最终实现对“慢行”和“停车让行”标志的高精度识别。
阅读全文
本期介绍了如何利用MATLAB的Image Labeler工具标注数据并训练RCNN目标检测器(以AlexNet为骨干网络),最终实现对“慢行”和“停车让行”标志的高精度识别。
阅读全文
摘要:
今天,我们来探讨如何利用YOLO算法实现热力图的展示。YOLO算法最常见的应用是目标检测,但它其实隐藏着许多其他技能,比如热力图生成。这项功能可以帮助我们直观地分析视频或图像中目标物体的位置和趋势。
阅读全文
今天,我们来探讨如何利用YOLO算法实现热力图的展示。YOLO算法最常见的应用是目标检测,但它其实隐藏着许多其他技能,比如热力图生成。这项功能可以帮助我们直观地分析视频或图像中目标物体的位置和趋势。
阅读全文
摘要:
【YOLOv12实战】寥寥数行代码实现目标跟踪与速度估计,新手也能轻松搞定!
阅读全文
【YOLOv12实战】寥寥数行代码实现目标跟踪与速度估计,新手也能轻松搞定!
阅读全文
摘要:
该视频处理工具基于YOLO12模型实现目标物体的自动裁剪和模糊打码功能。文章详细解析了其核心代码逻辑,包括VideoProcessor类负责视频处理(加载、检测、裁剪、模糊)和VideoPlayer类实现用户界面交互。工具采用Ultralytics框架调用YOLO12n预训练模型,支持实时处理视频流并保存结果,具有高效的目标检测能力和灵活的功能切换。系统通过模块化设计分离处理逻辑与界面控制,提供直观的操作体验,适用于隐私保护等场景。
阅读全文
该视频处理工具基于YOLO12模型实现目标物体的自动裁剪和模糊打码功能。文章详细解析了其核心代码逻辑,包括VideoProcessor类负责视频处理(加载、检测、裁剪、模糊)和VideoPlayer类实现用户界面交互。工具采用Ultralytics框架调用YOLO12n预训练模型,支持实时处理视频流并保存结果,具有高效的目标检测能力和灵活的功能切换。系统通过模块化设计分离处理逻辑与界面控制,提供直观的操作体验,适用于隐私保护等场景。
阅读全文
摘要:
本文介绍了一个基于YOLO算法的运动监测项目,通过识别人体17个关键关节节点,实现对俯卧撑、深蹲等动作的自动计数。项目使用Python+OpenCV+Ultralytics解决方案,核心原理是通过分析关节弯曲角度变化(如俯卧撑监测肩膀、肘部、手腕的角度)来识别动作状态并计数。文章详细解析了代码实现流程,包括视频读取、AIGym对象初始化、帧处理循环等,并展示了不同动作(深蹲、压腿、高抬腿)的监测示例。该项目适合计算机视觉和体育健康领域的爱好者,可根据实际需求调整关键点、模型和角度阈值参数。
阅读全文
本文介绍了一个基于YOLO算法的运动监测项目,通过识别人体17个关键关节节点,实现对俯卧撑、深蹲等动作的自动计数。项目使用Python+OpenCV+Ultralytics解决方案,核心原理是通过分析关节弯曲角度变化(如俯卧撑监测肩膀、肘部、手腕的角度)来识别动作状态并计数。文章详细解析了代码实现流程,包括视频读取、AIGym对象初始化、帧处理循环等,并展示了不同动作(深蹲、压腿、高抬腿)的监测示例。该项目适合计算机视觉和体育健康领域的爱好者,可根据实际需求调整关键点、模型和角度阈值参数。
阅读全文
摘要:
本文介绍了一个基于YOLO算法的工具,能够对视频和图片进行实时目标跟踪和分割。该工具使用PyQt5构建界面,采用Ultralytics的YOLOv11模型实现目标检测、跟踪和实例分割功能。支持本地文件选择、实时结果显示及结果保存。视频处理时能显示边界框、类别标签和分割掩码,图片处理可精准分割目标。文章详细说明了工具的核心原理、演示效果和代码实现,提供了完整的Python代码和依赖安装说明。该工具适合计算机视觉初学者学习,可通过更换更大模型提升性能。
阅读全文
本文介绍了一个基于YOLO算法的工具,能够对视频和图片进行实时目标跟踪和分割。该工具使用PyQt5构建界面,采用Ultralytics的YOLOv11模型实现目标检测、跟踪和实例分割功能。支持本地文件选择、实时结果显示及结果保存。视频处理时能显示边界框、类别标签和分割掩码,图片处理可精准分割目标。文章详细说明了工具的核心原理、演示效果和代码实现,提供了完整的Python代码和依赖安装说明。该工具适合计算机视觉初学者学习,可通过更换更大模型提升性能。
阅读全文
摘要:
本期视频介绍了基于PyTorch的车牌识别模型LPRNet的调试运行过程。主要内容包括:1)项目结构分析和环境配置;2)单张图片识别代码实现,涵盖图像预处理、模型预测和结果可视化;3)注意事项说明。该模型支持蓝牌和新能源车牌识别,具有轻量级特性,适合实际应用开发。视频详细演示了从源码获取到运行测试的全流程,并提供了处理单张车牌图像的关键代码解析。
阅读全文
本期视频介绍了基于PyTorch的车牌识别模型LPRNet的调试运行过程。主要内容包括:1)项目结构分析和环境配置;2)单张图片识别代码实现,涵盖图像预处理、模型预测和结果可视化;3)注意事项说明。该模型支持蓝牌和新能源车牌识别,具有轻量级特性,适合实际应用开发。视频详细演示了从源码获取到运行测试的全流程,并提供了处理单张车牌图像的关键代码解析。
阅读全文
摘要:
本文介绍了一个基于YOLOv12深度学习的机动车车牌检测系统。该系统采用PyQt5构建图形界面,支持图片和视频输入,能实时检测并分割车牌区域,同时提供结果保存功能。项目使用约1300张包含多角度、多颜色变化的车牌图像进行训练,提升模型鲁棒性。代码部分详细展示了界面设计、YOLO模型调用、图像处理等核心功能实现,并提供了可选的自定义训练脚本。该系统操作简便,检测效果良好,适合作为深度学习目标检测的入门实践项目。
阅读全文
本文介绍了一个基于YOLOv12深度学习的机动车车牌检测系统。该系统采用PyQt5构建图形界面,支持图片和视频输入,能实时检测并分割车牌区域,同时提供结果保存功能。项目使用约1300张包含多角度、多颜色变化的车牌图像进行训练,提升模型鲁棒性。代码部分详细展示了界面设计、YOLO模型调用、图像处理等核心功能实现,并提供了可选的自定义训练脚本。该系统操作简便,检测效果良好,适合作为深度学习目标检测的入门实践项目。
阅读全文
摘要:
【摘要】本文介绍了一个基于PyQt5开发的YOLO模型性能曲线对比工具,可自动化处理不同版本YOLO模型的训练结果对比。该工具支持多CSV文件加载、曲线颜色自定义、指标切换(召回率、精准度等)、坐标轴调整及高清图片导出功能,解决了传统手动对比曲线的繁琐问题。核心代码实现了UI布局、数据加载、动态绘图等功能,支持跨平台中文字体适配。工具适用于论文写作和模型评估场景,可显著提升多模型性能对比效率。
阅读全文
【摘要】本文介绍了一个基于PyQt5开发的YOLO模型性能曲线对比工具,可自动化处理不同版本YOLO模型的训练结果对比。该工具支持多CSV文件加载、曲线颜色自定义、指标切换(召回率、精准度等)、坐标轴调整及高清图片导出功能,解决了传统手动对比曲线的繁琐问题。核心代码实现了UI布局、数据加载、动态绘图等功能,支持跨平台中文字体适配。工具适用于论文写作和模型评估场景,可显著提升多模型性能对比效率。
阅读全文
摘要:
【YOLO训练结果详解】视频图文解析YOLO模型训练后生成的关键结果文件:1.参数配置文件args.yaml;2.Precision/Recall/F1曲线及PR曲线;3.混淆矩阵分析误识别;4.数据集统计图;5.训练日志results.csv;6.损失函数变化图;7.训练验证样本图;8.最终权重文件。通过手势识别案例(布/石头/剪刀三类),详细解读各文件作用,帮助优化模型部署。重点说明置信度阈值选择(F1最佳值0.658时对应0.94分数)和mAP@0.5达96.1%的高准确率表现。
阅读全文
【YOLO训练结果详解】视频图文解析YOLO模型训练后生成的关键结果文件:1.参数配置文件args.yaml;2.Precision/Recall/F1曲线及PR曲线;3.混淆矩阵分析误识别;4.数据集统计图;5.训练日志results.csv;6.损失函数变化图;7.训练验证样本图;8.最终权重文件。通过手势识别案例(布/石头/剪刀三类),详细解读各文件作用,帮助优化模型部署。重点说明置信度阈值选择(F1最佳值0.658时对应0.94分数)和mAP@0.5达96.1%的高准确率表现。
阅读全文
摘要:
本文介绍了一个基于Zero-DCE深度学习模型的图像增强系统,能够自动优化曝光不足的暗淡图片。该系统采用PyQt5构建GUI界面,集成了预训练模型,支持快速图像增强处理(仅需几秒)。文章详细展示了系统原理、效果演示(包括夜景、街景等场景增强对比)、代码实现(含图像加载、模型推理、结果显示和保存功能)以及二次训练方法。该系统无需成对训练数据,通过增强曲线实现零参考学习,支持使用自定义数据集进行模型优化。完整代码和打包文件可通过作者获取。
阅读全文
本文介绍了一个基于Zero-DCE深度学习模型的图像增强系统,能够自动优化曝光不足的暗淡图片。该系统采用PyQt5构建GUI界面,集成了预训练模型,支持快速图像增强处理(仅需几秒)。文章详细展示了系统原理、效果演示(包括夜景、街景等场景增强对比)、代码实现(含图像加载、模型推理、结果显示和保存功能)以及二次训练方法。该系统无需成对训练数据,通过增强曲线实现零参考学习,支持使用自定义数据集进行模型优化。完整代码和打包文件可通过作者获取。
阅读全文
摘要:
Meta开源SAM3图像分割模型,支持文本提示精准分割目标。本文提供Windows本地部署详细教程,包含环境配置、依赖安装、权重下载等完整步骤,并解决triton缺失和权重访问等常见问题。通过修改源码加载本地权重文件sam3.pt,即可实现文本提示分割功能。教程附带测试代码示例,支持自定义文本提示词进行目标分割。作者还提供了后续进阶玩法预告,包括视频追踪等应用场景。
阅读全文
Meta开源SAM3图像分割模型,支持文本提示精准分割目标。本文提供Windows本地部署详细教程,包含环境配置、依赖安装、权重下载等完整步骤,并解决triton缺失和权重访问等常见问题。通过修改源码加载本地权重文件sam3.pt,即可实现文本提示分割功能。教程附带测试代码示例,支持自定义文本提示词进行目标分割。作者还提供了后续进阶玩法预告,包括视频追踪等应用场景。
阅读全文
摘要:
摘要:视频目标检测常面临信息过载问题,YOLO模型会标记画面中所有对象,导致关键信息被淹没。Ultralytics的TrackZone工具可完美解决该痛点,它通过框选感兴趣区域(ROI),仅检测特定范围内的目标。演示显示:TrackZone能有效过滤干扰,提升检测速度,特别适合违停监控、出入口统计等场景。核心代码仅需20行,配合作者开发的交互式坐标框选工具,可实现零代码ROI设定。该方案大幅降低计算量,自带目标跟踪ID,是视频分析场景的轻量化解决方案。
阅读全文
摘要:视频目标检测常面临信息过载问题,YOLO模型会标记画面中所有对象,导致关键信息被淹没。Ultralytics的TrackZone工具可完美解决该痛点,它通过框选感兴趣区域(ROI),仅检测特定范围内的目标。演示显示:TrackZone能有效过滤干扰,提升检测速度,特别适合违停监控、出入口统计等场景。核心代码仅需20行,配合作者开发的交互式坐标框选工具,可实现零代码ROI设定。该方案大幅降低计算量,自带目标跟踪ID,是视频分析场景的轻量化解决方案。
阅读全文
摘要:
本文介绍了一种基于YOLO系列深度学习算法的水果品质检测系统。该系统可自动识别多种水果(如草莓、香蕉等)及其变质程度(优质、轻微变质、腐烂),使用超过21,000张图片的数据集训练,在YOLOv5、v8、v11和v12等多个模型版本中实现高精度检测。系统采用三栏式用户界面,支持图片、视频、摄像头等多种检测方式,并具备模型切换、参数调整等功能。性能测试显示YOLO12n模型达到最佳检测精度(mAP40.6%),而YOLO11n在速度上表现最优(CPU推理56.1ms)。该系统有效解决了传统人工检测效率低、主观性强的问题,适用于农业和食品安全领域。
阅读全文
本文介绍了一种基于YOLO系列深度学习算法的水果品质检测系统。该系统可自动识别多种水果(如草莓、香蕉等)及其变质程度(优质、轻微变质、腐烂),使用超过21,000张图片的数据集训练,在YOLOv5、v8、v11和v12等多个模型版本中实现高精度检测。系统采用三栏式用户界面,支持图片、视频、摄像头等多种检测方式,并具备模型切换、参数调整等功能。性能测试显示YOLO12n模型达到最佳检测精度(mAP40.6%),而YOLO11n在速度上表现最优(CPU推理56.1ms)。该系统有效解决了传统人工检测效率低、主观性强的问题,适用于农业和食品安全领域。
阅读全文

浙公网安备 33010602011771号