随笔分类 - 目标检测
摘要:Two Stage 的精度优势 二阶段的分类:二步法的第一步在分类时,正负样本是极不平衡的,导致分类器训练比较困难,这也是一步法效果不如二步法的原因之一,也是focal loss的motivation。而第二步在分类时,由于第一步滤掉了绝大部分的负样本,送给第二步分类的proposal中,正负样本比
        阅读全文
                
摘要:作者丨不摸鱼的小律@知乎来源丨https://zhuanlan.zhihu.com/p/592531559 开头 最近参加一个CV比赛,看到有参赛者分享了自己训练图像识别模型时常用到的小技巧,故对其进行记录、整理,方便未来继续学习。整理了很多,它们不一定每次有用,但请记在心中,说不定未来某个任务它们
        阅读全文
                
摘要:非极大值抑制(Non-Maximum Suppression,NMS)是一种常用于目标检测和计算机视觉任务的技术,用于从重叠的检测框中选择最佳的候选框。以下是使用 PyTorch 实现标准的 NMS 算法的示例代码: import torch def nms(boxes, scores, iou_t
        阅读全文
                
摘要:目标检测与图像分类不同,目标检测不仅要对检测出来的目标框正确分类,同时,还需要考虑目标框与target是否贴合。 首先我们需要知道几个常见指标: TP (True Positive):iou>0.5的检测框数量。在上图中,绿色的框表示GT,其中cat 0.9的红色框就是TP。 FP (False P
        阅读全文
                
摘要:一、样本匹配 YOLO系列算法一般的网络输出如图1所示: 图1 输出为80*80*85的Tensor(以COCO数据集为例),即在80*80的尺度上,每一个点位都输出一个长度85的Tensor,85意为80个类别信息、1个box坐标信息以及1个置信度信息。对于yolov5来说,每一个点位上有3个不同
        阅读全文
                
摘要:相关错误如下: RuntimeError: CUDA out of memory. Tried to allocate 6.18 GiB (GPU 0; 24.00 GiB total capacity; 11.39 GiB already allocated; 3.43 GiB free; 17.
        阅读全文
                
摘要:👻解耦合头和耦合头是目标检测中常见的两种头部设计,用于从检测网络的特征图中提取目标位置和类别信息。 (先看概念,概念看不懂可以直接看图一定能懂😁) 文章目录 耦合头(Coupled head) 解耦合头(Decoupled head) 概念图 总结 耦合头(Coupled head) 耦合头通常
        阅读全文
                
摘要:在目标检测领域,能大规模应用在业务领域和工业领域的,很大一部分都是采用yolo来做,我们知道yolo这个系列,除了v1和v2和x以外,都是基于anchor base的。这也从侧面说明,anchor base其实更适用业务,我们知道业务上肯定是追求高召回和高准确率,所以anchor free很显然不能
        阅读全文
                
摘要:首先偏移量的公式为: 这些偏移量的范围都是0-1,所以采用BCE来计算坐标定位损失 中心点的偏移decode为公式1和公式2,偏移值是在卷积的特征上算的,卷积特征是尺度不变的,所以预测除以宽高后的偏移比例,该比例为与尺度无关的值 宽高的尺寸缩放比例decode为公式3和公式4,跟中心点偏移一样,缩放
        阅读全文
                
摘要:yolov5——训练策略 前言 1. 训练预热——Warmup 1.1 what是Warmup 1.2 why用Warmup 1.3 常见Warmup类型 1.4 yolov5中的Warmup 2. 自动调整锚定框——Autoanchor 2.1 what是anchor 2.2 why用anchor
        阅读全文
                
摘要:一、背景介绍 Focus层是在YOLOv5中被提出来的。感觉像是一种特殊的下采样的方式。 1.下采样 下采样就是一种缩小图像的手法,用来降低特征的维度并保留有效信息,一定程度上避免过拟合,都是以牺牲部分信息为代价,换取数据量的减少。下采样就是池化操作。但是池化的目的不仅如此,还需要考虑旋转、平移、伸
        阅读全文
                
摘要:图像任务中,传入到模型的图像尺寸往往是固定的,十万个为什么由此发问: 1 那为什么是固定的? 模型网络中含有全连接层的时候,输入尺寸只能固定大小,因为全连接网络的输入feature尺寸是固定的。一些模型网络就不一定需要尺寸固定,比如FCN网络中全是卷积网络而没有连接网络。 yolov5比较特殊,输入
        阅读全文
                
摘要:目录 一、SPP的应用的背景 二、SPP结构分析 三、SPPF结构分析 四、YOLOv5中SPP/SPPF结构源码解析(内含注释分析) 一、SPP的应用的背景 在卷积神经网络中我们经常看到固定输入的设计,但是如果我们输入的不能是固定尺寸的该怎么办呢? 通常来说,我们有以下几种方法: (1)对输入进行
        阅读全文
                
摘要:自适应图片缩放-针对不同的目标检测算法而言,我们通常需要执行图片缩放操作,即将原始的输入图片缩放到一个固定的尺寸,再将其送入检测网络中。YOLO 系列算法中常用的尺寸包括416 * 416,608 * 608 等尺寸。 原始的缩放方法存在着一些问题,因为在实际的使用中的很多图片的长宽比不同,所以在进
        阅读全文
                
摘要:现在网路上关于yolov5的自适应锚框策略都是一笔带过,今天专门来说一下这个 像之前的 YOLOv3、YOLOv4,对于不同的数据集,都会计算先验框 anchor。然后在网络训练时,网络会在 anchor 的基础上进行预测,然后输出预测框,再和标签框进行对比,最后就进行梯度地反向传播。 在 YOLO
        阅读全文
                
摘要:1、技术原理 Mosaic是YOLOV4中提出的新方法,适用于目标检测,主要思想是将四张图片进行拼接到一张图上作为训练样本。由于Mosaic用于目标检测,进行拼接时目标框的坐标也要做相应的变化。Mosaic的主要操作如下: 对每一张图进行随机裁剪得到A;crop的目标是选择原图的某一块区域,而不是全
        阅读全文
                
摘要:Bounding box(边界框)和Anchor box(锚框)是目标检测中两个不同的概念。 Bounding box(边界框)是用来描述目标在图像中位置和范围的矩形框。它由矩形框的左上角和右下角坐标定义,可以用来标记和定位目标物体。在目标检测任务中,模型通过预测目标物体的边界框来实现目标检测和定位
        阅读全文
                
摘要:在YOLOv5中,S、M、L、X是用来表示不同的检测器尺寸或大小的标签。它们指的是YOLO检测器的不同变体,其主要区别在于其基础网络架构和输入图像的分辨率。 以下是它们的具体含义: 1. YOLOv5s(Small):这是YOLOv5中的最小尺寸变体。它具有相对较小的模型尺寸和输入图像分辨率,适用于
        阅读全文
                
摘要:场景: 我有一个数据集,8个类别,voc格式,现在我只想训练其中的4个类别,正常我们的做法就是把类别名和数量改下就行了,但是在yolov5的官方代码中却存在一个bug,该bug在utils/datasets.py的cache_labels()方法中,主要问题是该方法会读取标注文件的objects,获
        阅读全文
                
摘要:0.首次运行常见错误 刚拿到代码可以运行train.py文件看看,一般都会出现这个错误: OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program. That i
        阅读全文
                

 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号