摘要: GOT-OCR2.0 是一个端到端的的OCR项目,它采用了多模态视觉-语言大模型架构:预训练VitDet 视觉模型+ 阿里通义千问Qwen语言模型,具有多方面优良特性。 本人环境:window11 + python3.10 + cuda12.8 成功安装了GOT-OCR2.0,期间也遇到了一些问题和 阅读全文
posted @ 2025-09-16 16:06 ttweixiao9999 阅读(72) 评论(0) 推荐(0)
摘要: 1. 图像细化基础理论 对图像细化的过程实际上是求图像骨架的过程。图像骨架是二维二值目标的重要拓扑描述,它指的是图像中央的骨骼部分,是描述像几何及拓扑性质的重要特征之一。例如一个长方形的骨架是其长方向上的中轴线,正方形的骨架是它的中心点,圆的骨架是它的圆心,直线的骨架是它自身,孤立点的骨架也是它自身 阅读全文
posted @ 2025-04-07 17:21 ttweixiao9999 阅读(206) 评论(0) 推荐(0)
摘要: 本文以鸟巢检测数据集为例,展示如何把 voc 格式的数据集转换成 yolov8 格式数据集,本文将从数据集下载、数据集格式转换和数据集划分三个方面进行解说。 (1)数据集下载。 本次所使用的数据集是鸟巢检测数据集,该数据集共有200张图片,展示了在输电线上鸟巢的搭建情况,鸟类在这些线路杆塔上筑巢可能 阅读全文
posted @ 2024-11-12 09:23 ttweixiao9999 阅读(925) 评论(0) 推荐(0)
摘要: 本文实现使用yolov8训练自己的火灾数据集。 1. 数据的获取。 本文所使用的火灾数据集是在Roboflow上下载的。Roboflow是一款专为YOLOv8设计的自动化训练数据工具,它为YOLOv8提供了一种更便捷、更快速的方式来准备训练数据。它能够自动从开发者提供的原始图像数据中提取所需的信息, 阅读全文
posted @ 2024-07-31 10:02 ttweixiao9999 阅读(1614) 评论(0) 推荐(0)
摘要: 本文实现在 windows + CPU 的环境下实现实时火宅检测 项目网址:https://github.com/noorkhokhar99/Fire-Detection-using-YOLOv8 具体实现步骤: 1. 使用 Anaconda 搭建一个新的虚拟环境: conda create -n 阅读全文
posted @ 2024-07-29 09:29 ttweixiao9999 阅读(360) 评论(0) 推荐(0)
摘要: YOLOv8 由 Ultralytics 提供,并支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。这种多功能性使用户能够在各种应用和领域中利用 YOLOv8 的功能。 1. Windows 环境下使用 CPU 运行 yolov8 环境搭建 (1)使用 Anaconda 搭建 yo 阅读全文
posted @ 2024-07-23 15:30 ttweixiao9999 阅读(2329) 评论(0) 推荐(0)
摘要: TensorFlow Object Detection API 提供了在 COCO 2017 数据集上预训练的检测模型集合。如果你要识别的对象存在于 COCO2017 数据集,那么你就可以直接使用 TensorFlow Object Detection API 来检测图片或视频。 TensorFlo 阅读全文
posted @ 2023-12-27 17:07 ttweixiao9999 阅读(847) 评论(0) 推荐(0)
摘要: 在运用深度学习模型时,掌握运用预训练模型的方法是必不可少的一步。为什么要使用与训练的模型,原因归纳如下: (1)使用大量高质量的数据(如 ImageNet 是普林斯顿大学与斯坦福大学所主导的项目)又加上设计较复杂的模型结构(如ResNet模型高达150层)设计出来的模型,准确率会大大提高。 (2)可 阅读全文
posted @ 2023-11-30 11:56 ttweixiao9999 阅读(392) 评论(0) 推荐(0)
摘要: 最近在捣腾基于 yolov5 的行人检测代码,在 github 上下载一个案例之后因为没用 GPU 运行一直碰壁,出现了许多 bug,现在整理了下 error 和解决方法,成功调试出了基于 yolov5 的行人检测代码,分享给大家~ 1. 运行环境:window10,CPU,Visual Studi 阅读全文
posted @ 2023-07-19 16:24 ttweixiao9999 阅读(719) 评论(0) 推荐(0)
摘要: 在最近的学习中,看到代码中展示了如何画出支持向量机分类结果的决策面、最大间隙面和支持向量,即确定用支持向量机分类函数 SVC 进行分类后得到分类超平面和间隙面函数以及支持向量坐标的方法,分享给大家~ 1. 训练 svm 分类器 SVC 代码 1 from sklearn import svm 2 i 阅读全文
posted @ 2023-06-20 16:49 ttweixiao9999 阅读(374) 评论(0) 推荐(0)
摘要: 大多数的深度学习框架至少都会具备以下功能: (1)张量运算 (2)自动微分 (3)神经网络及各种神经层 TensorFlow 框架亦是如此。在《深度学习全书 公式+推导+代码+TensorFlow全程案例》—— 洪锦魁主编 清华大学出版社 ISBN 978-7-302-61030-4 这本书第3章 阅读全文
posted @ 2023-05-30 15:14 ttweixiao9999 阅读(92) 评论(0) 推荐(0)
摘要: 1. 知识点简介 最小二乘法(Ordinary Least Squares, OLS)是常见的估计模型参数的方法。 早在19世纪,勒让德就认为按照 “误差的平方和最小” 这个规则估计出来的模型是最接近真实情形的。于是就有: 其中,yi 是观测值或真实值,即样本数据,即采集得到的数据。f(xi) 是把 阅读全文
posted @ 2023-03-03 09:02 ttweixiao9999 阅读(3031) 评论(0) 推荐(0)
摘要: 最大似然估计法,是学习深度学习不可缺少的知识,在 《深度学习全书 公式+推导+代码+TensorFlow全程案例》—— 洪锦魁主编 清华大学出版社 ISBN 978-7-302-61030-4 这本书中看到了相关知识,简洁明了,分享给大家~ 1. 知识点 最大似然估计法(MLE, Maximum L 阅读全文
posted @ 2023-02-15 16:33 ttweixiao9999 阅读(729) 评论(0) 推荐(0)
摘要: 最近在看《深度学习全书 公式+推导+代码+TensorFlow全程案例》—— 洪锦魁主编 清华大学出版社 ISBN 978-7-302-61030-4 这本书,在第2章 神经网络原理 中 2-3-3 偏微分的内容中有个使用梯度下降法找最小值的代码,在机器学习的很多问题中,都可以通过使用梯度下降算法最 阅读全文
posted @ 2022-12-06 16:02 ttweixiao9999 阅读(782) 评论(0) 推荐(0)
摘要: 最近看了《TensorFlow深度学习实战(微课视频版)》 —— 清华大学出版社一书中的 11 章节《基于ResNet的花卉图片分类》,觉得写的不错,是个关于ResNet的好例子,所以整理下,分享给大家~ 本代码使用 Tensorflow 框架,搭建 ResNet50 模型,对花卉数据集 —— Ox 阅读全文
posted @ 2022-12-01 15:51 ttweixiao9999 阅读(1728) 评论(0) 推荐(1)