YOLOv8改进- - Snu77

YOLOv8改进 | Conv篇 | 轻量级下采样方法ContextGuided（大幅度涨点）

摘要：本文给大家带来的是改进机制是一种替换Conv的模块Context Guided Block (CG block) ，其是在CGNet论文中提出的一种模块，其基本原理是模拟人类视觉系统依赖上下文信息来理解场景。CG block 用于捕获局部特征、周围上下文和全局上下文，并将这些信息融合起来以提高准确性。(经过我检验分别在三种数据集上，大中小均进行了150轮次的实验，均有一定程度上的涨点，下面我选取了一种中等大小的数据集的结果进行了对比)，同时本文的修改方法和之前的普通卷积模块也有所不同，大家需要注意看章节四进行修改。阅读全文

posted @ 2024-01-15 18:49 Snu77 阅读(984) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | DiverseBranchBlock多元分支模块（有效涨点）

摘要：一、本文介绍本文带来的改进机制是YOLOv8模型与多元分支模块（Diverse Branch Block）的结合，Diverse Branch Block (DBB) 是一种用于增强卷积神经网络性能的结构重新参数化技术。这种技术的核心在于结合多样化的分支，这些分支具有不同的尺度和复杂度，从而丰富特征空间。我将其放在了YOLOv8的不同位置上均有一定的涨点幅度，同时这个DBB模块的参数量并不会上涨太多，我添加三个该机制到模型中，GFLOPs上涨了0.4。阅读全文

posted @ 2024-01-15 18:51 Snu77 阅读(398) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | SPD-Conv空间深度转换卷积（高效空间编码技术）

摘要：本文给大家带来的改进内容是SPD-Conv（空间深度转换卷积）技术。SPD-Conv是一种创新的空间编码技术，它通过更有效地处理图像数据来改善深度学习模型的表现。SPD-Conv的基本概念：它是一种将图像空间信息转换为深度信息的技术，从而使得卷积神经网络（CNN）能更加有效地学习图像特征。这种方法通过减少信息损失和提高特征提取的准确性，优化了模型对小物体和低分辨率图像的处理能力。我在YOLOv8中利用SPD-Conv被用于替换传统的步长卷积和池化层，在不牺牲精确度的情况下减少计算复杂度（精度甚至略有提升）。本文后面会有SPD-Conv的代码和使用方法，手把手教你添加到自己的网络结构中。(值得一提的是该卷积模块可以做到轻量化模型的作用GFLOPs由8.9降低到8.2，参数量也有一定降低) 阅读全文

posted @ 2024-01-15 18:53 Snu77 阅读(831) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | AKConv轻量级架构下的高效检测（既轻量又提点）

摘要：本文给大家带来的改进内容是AKConv是一种创新的变核卷积，它旨在解决标准卷积操作中的固有缺陷（采样形状是固定的），AKConv的核心思想在于它为卷积核提供了任意数量的参数和任意采样形状，能够使用任意数量的参数（如1, 2, 3, 4, 5, 6, 7等）来提取特征，这在标准卷积和可变形卷积中并未实现。AKConv能够根据硬件环境，使卷积参数的数量呈线性增减（非常适用于轻量化模型的读者）。本文通过先介绍AKConv的基本网络结构和原理让大家对该卷积有一个大概的了解，然后教大家如何将该卷积添加到自己的网络结构中。阅读全文

posted @ 2024-01-15 18:54 Snu77 阅读(562) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | SCConv空间和通道重构卷积（精细化检测，又轻量又提点）

摘要：本文给大家带来的改进内容是SCConv，即空间和通道重构卷积，是一种发布于2023.9月份的一个新的改进机制。它的核心创新在于能够同时处理图像的空间（形状、结构）和通道（色彩、深度）信息，这样的处理方式使得SCConv在分析图像时更加精细和高效。这种技术不仅适用于复杂场景的图像处理，还能在普通的对象检测任务中提供更高的精确度(亲测在小目标检测和正常的物体检测中都有效提点)。SCConv的这种能力，特别是在处理大量数据和复杂图像时的优势。本文通过先介绍SCConv的基本网络结构和原理当大家对该卷积有一个大概的了解，然后教大家如何将该卷积添加到自己的网络结构中(值得一提的是该卷积的GFLOPs降低了0.3左右适合轻量化的读者) 。阅读全文

posted @ 2024-01-15 18:54 Snu77 阅读(803) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | 通过RFAConv重塑空间注意力（深度学习的前沿突破）

摘要：本文给大家带来的改进机制是RFAConv，全称为Receptive-Field Attention Convolution，是一种全新的空间注意力机制。与传统的空间注意力方法相比，RFAConv能够更有效地处理图像中的细节和复杂模式(适用于所有的检测对象都有一定的提点)。这不仅让YOLOv8在识别和定位目标时更加精准，还大幅提升了处理速度和效率。本文章深入会探讨RFAConv如何在YOLOv8中发挥作用，以及它是如何改进在我们的YOLOv8中的。我将通过案例的角度来带大家分析其有效性(结果训练结果对比图)。阅读全文

posted @ 2024-01-15 18:55 Snu77 阅读(223) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | DWRSeg扩张式残差助力小目标检测（附修改后的C2f+Bottleneck）

摘要：本文内容给大家带来的DWRSeg中的DWR模块来改进YOLOv8中的C2f和Bottleneck模块，主要针对的是小目标检测，主要创新点可以总结如下：多尺度特征提取机制的深入研究和创新的DWR模块和SIR模块的提出，这种方法使得网络能够更灵活地适应不同尺度的特征，从而更准确地识别和分割图像中的物体。通过本文你能够了解到：DWRSeg的基本原理和框架，并且能够在你自己的网络结构中进行添加(DWRSeg需要增加一定的计算量一个DWR模块大概增加0.4GFLOPs)。阅读全文

posted @ 2024-01-15 18:57 Snu77 阅读(584) 评论(0) 推荐(0)

YOLOv8改进 | SAConv可切换空洞卷积（附修改后的C2f+Bottleneck）

摘要：本文给大家带来的改进机制是可切换的空洞卷积（Switchable Atrous Convolution, SAC）是一种创新的卷积网络机制，专为增强物体检测和分割任务中的特征提取而设计。SAC的核心思想是在相同的输入特征上应用不同的空洞率进行卷积，并通过特别设计的开关函数来融合这些不同卷积的结果。这种方法使得网络能够更灵活地适应不同尺度的特征，从而更准确地识别和分割图像中的物体。通过本文你能够了解到：可切换的空洞卷积的基本原理和框架，能够在你自己的网络结构中进行添加(值得一提的是一个SAConv大概可以降低0.3GFLOPs)。阅读全文

posted @ 2024-01-15 18:57 Snu77 阅读(435) 评论(0) 推荐(0)

YOLOv8改进 | ODConv卷积助力极限涨点（附修改后的C2f、Bottleneck模块代码）

摘要：这篇文章给大家带来的是发表于2022年的ODConv(Omni-Dimensional Dynamic Convolution)中文名字全维度动态卷积，该卷积可以即插即用，可以直接替换网络结构中的任何一个卷积模块，在本文的末尾提供可以直接替换卷积模块的ODConv，添加ODConv模块的C2f和Bottleneck(配合教程将代码复制粘贴到你自己的代码中即可运行)给大家，该卷积模块主要具有更小的计算量和更高的精度，其中添加ODConv模块的网络(只替换了一处C2f中的卷积)参数量由8.9GFLOPS减小到8.8GFLOPS，精度也有提高->下面的图片是精度的对比(因为训练成本我只是用了相同的数据集100张图片除了修改了ODConv以后其他配置都相同下面是效果对比图左面为修改版本，右面为基础版本) 阅读全文

posted @ 2024-01-15 18:58 Snu77 阅读(1784) 评论(0) 推荐(0)

YOLOv8改进有效涨点系列-＞多位置替换可变形卷积(DCNv1、DCNv2、DCNv3)

摘要：动态蛇形卷积的灵感来源于对管状结构的特殊性的观察和理解，在分割拓扑管状结构、血管和道路等类型的管状结构时，任务的复杂性增加，因为这些结构的局部结构可能非常细长和迂回，而整体形态也可能多变。因此为了应对这个挑战，作者研究团队注意到了管状结构的特殊性，并提出了动态蛇形卷积（Dynamic Snake Convolution）这个方法。动态蛇形卷积通过自适应地聚焦于细长和迂回的局部结构，准确地捕捉管状结构的特征。这种卷积方法的核心思想是，通过动态形状的卷积核来增强感知能力，针对管状结构的特征提取进行优化。总之动态蛇形卷积是一种针对管状结构分割任务的创新方法，在许多模型上添加针对一些数据集都能够有效的涨点，其具有重要性和广泛的应用领域。阅读全文

posted @ 2024-01-15 19:00 Snu77 阅读(1148) 评论(0) 推荐(0)

YOLOv8改进 | 注意力篇 | ACmix自注意力与卷积混合模型（提高FPS+检测效率）

摘要：本文给大家带来的改进机制是ACmix自注意力机制的改进版本，它的核心思想是，传统卷积操作和自注意力模块的大部分计算都可以通过1x1的卷积来实现。ACmix首先使用1x1卷积对输入特征图进行投影，生成一组中间特征，然后根据不同的范式，即自注意力和卷积方式，分别重用和聚合这些中间特征。这样，ACmix既能利用自注意力的全局感知能力，又能通过卷积捕获局部特征，从而在保持较低计算成本的同时，提高模型的性能。阅读全文

posted @ 2024-01-15 19:01 Snu77 阅读(463) 评论(0) 推荐(0)

YOLOv8改进 | 2023注意力篇 | MSDA多尺度空洞注意力（附多位置添加教程）

摘要：本文给大家带来的改进机制是MSDA（多尺度空洞注意力）发表于今年的中科院一区(算是国内计算机领域的最高期刊了)，其全称是"DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition"。MSDA的主要思想是通过线性投影得到特征图X的相应查询、键和值。然后，将特征图的通道分成n个不同的头部，并在不同的头部中以不同的扩张率执行多尺度SWDA来提高模型的处理效率和检测精度。亲测在小目标检测和大尺度目标检测的数据集上都有大幅度的涨点效果(mAP直接涨了大概有0.06左右)。最后本文会手把手教你添加MSDA模块到网络结构中。阅读全文

posted @ 2024-01-15 19:02 Snu77 阅读(758) 评论(0) 推荐(0)

YOLOv8改进 | 2023注意力篇 | HAttention(HAT）超分辨率重建助力小目标检测 (全网首发)

摘要：本文给大家带来的改进机制是HAttention注意力机制，混合注意力变换器（HAT）的设计理念是通过融合通道注意力和自注意力机制来提升单图像超分辨率重建的性能。通道注意力关注于识别哪些通道更重要，而自注意力则关注于图像内部各个位置之间的关系。HAT利用这两种注意力机制，有效地整合了全局的像素信息，从而提供更为精确的结果(这个注意力机制挺复杂的光代码就700+行)，但是效果挺好的也是10月份最新的成果非常适合添加到大家自己的论文中。阅读全文

posted @ 2024-01-15 19:03 Snu77 阅读(487) 评论(0) 推荐(1)

YOLOv8改进 | 2023 | RCS-OSA替换C2f实现暴力涨点（减少通道的空间对象注意力机制）

摘要：本文给大家带来的改进机制是RCS-YOLO提出的RCS-OSA模块，其全称是"Reduced Channel Spatial Object Attention"，意即"减少通道的空间对象注意力"。这个模块的主要功能是通过减少特征图的通道数量，同时关注空间维度上的重要特征，来提高模型的处理效率和检测精度。亲测在小目标检测和大尺度目标检测的数据集上都有大幅度的涨点效果(mAP直接涨了大概有0.6左右)。同时本文对RCS-OSA模块的框架原理进行了详细的分析，不光让大家会添加到自己的模型在写论文的时候也能够有一定的参照，最后本文会手把手教你添加RCS-OSA模块到网络结构中。阅读全文

posted @ 2024-01-15 19:04 Snu77 阅读(275) 评论(0) 推荐(0)

YOLOv8改进 | TripletAttention三重注意力机制（附代码+机制原理+添加教程）

摘要：本文给大家带来的改进是Triplet Attention三重注意力机制。这个机制，它通过三个不同的视角来分析输入的数据，就好比三个人从不同的角度来观察同一幅画，然后共同决定哪些部分最值得注意。三重注意力机制的主要思想是在网络中引入了一种新的注意力模块，这个模块包含三个分支，分别关注图像的不同维度。比如说，一个分支可能专注于图像的宽度，另一个分支专注于高度，第三个分支则聚焦于图像的深度，即色彩和纹理等特征。这样一来，网络就能够更全面地理解图像内容，就像是得到了一副三维眼镜，能够看到图片的立体效果一样。阅读全文

posted @ 2024-01-15 19:05 Snu77 阅读(527) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | Deformable-LKA可变形大核注意力（涨点幅度超高）

摘要：本文给大家带来的改进内容是Deformable-LKA（可变形大核注意力）。Deformable-LKA结合了大卷积核的广阔感受野和可变形卷积的灵活性，有效地处理复杂的视觉信息。这一机制通过动态调整卷积核的形状和大小来适应不同的图像特征，提高了模型对目标形状和尺寸的适应性。在YOLOv8中，Deformable-LKA可以被用于提升对小目标和不规则形状目标的检测能力，特别是在复杂背景或不同光照条件下。我进行了简单的实验，这一改进显著提高了模型mAP(提高了大概0.8左右)。Deformable-LKA，引入可以将其用在C2f和检测头中进行改进估计效果会更高，所以非常推荐大家使用。阅读全文

posted @ 2024-01-15 19:05 Snu77 阅读(646) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | LSKAttention大核注意力机制助力极限涨点

摘要：在这篇文章中，我们将讲解如何将LSKAttention大核注意力机制应用于YOLOv8，以实现显著的性能提升。首先，我们介绍LSKAttention机制的基本原理，它主要通过将深度卷积层的2D卷积核分解为水平和垂直1D卷积核，减少了计算复杂性和内存占用。接着，我们介绍将这一机制整合到YOLOv8的方法，以及它如何帮助提高处理大型数据集和复杂视觉任务的效率和准确性。本文还将提供代码实现细节和使用方法，展示这种改进对目标检测、语义分割等方面的积极影响。通过实验YOLOv8在整合LSKAttention机制后，实现了检测精度提升(下面会附上改进LSKAttention机制和基础版本的结果对比图)。阅读全文

posted @ 2024-01-15 19:07 Snu77 阅读(289) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | FocusedLinearAttention实现有效涨点

摘要：本文给大家带来的改进机制是Focused Linear Attention（聚焦线性注意力）是一种用于视觉Transformer模型的注意力机制(但是其也可以用在我们的YOLO系列当中从而提高检测精度)，旨在提高效率和表现力。其解决了两个在传统线性注意力方法中存在的问题：聚焦能力和特征多样性。这种方法通过一个高效的映射函数和秩恢复模块来提高计算效率和性能，使其在处理视觉任务时更加高效和有效。简言之，Focused Linear Attention是对传统线性注意力方法的一种重要改进，提高了模型的聚焦能力和特征表达的多样性。通过本文你能够了解到：Focused Linear Attention的基本原理和框架，能够在你自己的网络结构中进行添加(需要注意的是一个FLAGFLOPs从8.9涨到了9.1)。阅读全文

posted @ 2024-01-15 19:08 Snu77 阅读(246) 评论(0) 推荐(0)

YOLOv8改进 | DAttention (DAT)注意力机制实现极限涨点

摘要：本文给大家带来的是YOLOv8改进DAT(Vision Transformer with Deformable Attention)的教程，其发布于2022年CVPR2022上同时被评选为Best Paper，由此可以证明其是一种十分有效的改进机制，其主要的核心思想是：引入可变形注意力机制和动态采样点(听着是不是和可变形动态卷积DCN挺相似)。同时在网络结构中引入一个DAT计算量由8.9GFLOPs涨到了9.4GFLOPs。本文的讲解主要包含三方面：DAT的网络结构思想、DAttention的代码复现，如何添加DAttention到你的结构中实现涨点，下面先来分享我测试的对比图(因为资源有限，我只用了100张图片的数据集进行了100个epoch的训练，虽然这个实验不能产生确定性的结论，但是可以作为一个参考)。阅读全文

posted @ 2024-01-15 19:09 Snu77 阅读(1004) 评论(0) 推荐(0)

YOLOv8改进有效涨点系列-＞适合多种检测场景的BiFormer注意力机制(Bi-level Routing Attention)

摘要：BiFormer是一种结合了Bi-level Routing Attention的视觉Transformer模型，BiFormer模型的核心思想是引入了双层路由注意力机制。在BiFormer中，每个图像块都与一个位置路由器相关联。这些位置路由器根据特定的规则将图像块分配给上层和下层路由器。上层路由器负责捕捉全局上下文信息，而下层路由器则负责捕捉局部区域的细节。具体来说，上层路由器通过全局自注意力机制对所有图像块进行交互，并生成全局图像表示。下层路由器则使用局部自注意力机制对每个图像块与其邻近的图像块进行交互，并生成局部图像表示。通过这种双层路由注意力机制，BiFormer能够同时捕捉全局和局部的特征信息，从而提高了模型在视觉任务中的性能。阅读全文

posted @ 2024-01-15 19:10 Snu77 阅读(242) 评论(0) 推荐(0)

YOLOv8改进 | 2023注意力篇 | iRMB倒置残差块注意力机制（轻量化注意力机制）

摘要：本文给家大家带来的改进机制是iRMB，其是在论文Rethinking Mobile Block for Efficient Attention-based Models种提出，论文提出了一个新的主干网络EMO(后面我也会教大家如何使用该主干，本文先教大家使用该文中提出的注意力机制)。其主要思想是将轻量级的CNN架构与基于注意力的模型结构相结合(有点类似ACmix)，我将iRMB和C2f结合，然后也将其用在了检测头种进行尝试，三种结果进行对比，针对的作用也不相同，但是无论那种实验均有一定涨点效果，同时该注意力机制属于是比较轻量化的参数量比较小，训练速度也很快，后面我会将各种添加方法教给大家，让大家在自己的模型中进行复现。阅读全文

posted @ 2024-01-15 19:10 Snu77 阅读(244) 评论(0) 推荐(0)

YOLOv8改进 | 2023注意力篇 | EMAttention注意力机制（附多个可添加位置）

摘要：本文给大家带来的改进机制是EMAttention注意力机制，它的核心思想是，重塑部分通道到批次维度，并将通道维度分组为多个子特征，以保留每个通道的信息并减少计算开销。EMA模块通过编码全局信息来重新校准每个并行分支中的通道权重，并通过跨维度交互来捕获像素级别的关系。本文首先给大家提供效果图(由基础版本未作任何修改和修改了本文的改进机制的效果对比图)，然后介绍其主要的原理，最后手把手教大家如何添加该注意力机制。阅读全文

posted @ 2024-01-15 19:11 Snu77 阅读(480) 评论(0) 推荐(0)

YOLOv8改进 | 2023注意力篇 | MLCA混合局部通道注意力（轻量化注意力机制）

摘要：本文带来的改进机制是MLCA(Mixed local channel attention)翻译来就是混合局部通道注意力，它结合了局部和全局特征以及通道和空间特征的信息，根据文章的内容来看他是一个轻量化的注意力机制，能够在增加少量参数量的情况下从而大幅度的提高检测精度(论文中是如此描述的)，根据我的实验内容来看，该注意力机制确实参数量非常少，效果也算不错，而且官方的代码中提供了二次创新的思想和视频讲解非常推荐大家观看。阅读全文

posted @ 2024-01-15 19:12 Snu77 阅读(543) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | RevColV1可逆列网络（特征解耦助力小目标检测）

摘要：本文给大家带来的是主干网络RevColV1，翻译过来就是可逆列网络去发表于ICLR2022，其是一种新型的神经网络设计(和以前的网络结构的传播方式不太一样)，由多个子网络（列）通过多级可逆连接组成。这种设计允许在前向传播过程中特征解耦，保持总信息无压缩或丢弃。其非常适合数据集庞大的目标检测任务，数据集数量越多其效果性能越好，亲测在包含1000个图片的数据集上其涨点效果就非常明显了，大家可以多动手尝试，其RevColV2的论文同时已经发布如果代码开源我也会第一时间给大家上传。阅读全文

posted @ 2024-01-15 23:54 Snu77 阅读(147) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 利用SENetV1改进网络结构 (ILSVRC冠军得主)

摘要：本文给大家带来的改进机制是SENet（Squeeze-and-Excitation Networks）其是一种通过调整卷积网络中的通道关系来提升性能的网络结构。SENet并不是一个独立的网络模型，而是一个可以和现有的任何一个模型相结合的模块(可以看作是一种通道型的注意力机制)。在SENet中，所谓的挤压和激励（Squeeze-and-Excitation）操作是作为一个单元添加到传统的卷积网络结构中，如残差单元中(后面我会把修改好的残差单元给大家大家直接复制粘贴即可使用)。这样可以增强模型对通道间关系的捕获，提升整体的特征表达能力，而不需要从头开始设计一个全新的网络架构。因此，SENet可以看作是对现有网络模型的一种改进和增强(亲测大中小三中目标检测上都有一定程度的涨点效果)。阅读全文

posted @ 2024-01-16 00:05 Snu77 阅读(109) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 利用SENetV2改进网络结构 (全网首发改进)

摘要：本文给大家带来的改进机制是SENetV2，其是2023.11月的最新机制(所以大家想要发论文的可以在上面下点功夫)，其是一种通过调整卷积网络中的通道关系来提升性能的网络结构。SENet并不是一个独立的网络模型，而是一个可以和现有的任何一个模型相结合的模块(可以看作是一种通道型的注意力机制但是相对于SENetV1来说V2又在全局的角度进行了考虑)。在SENet中，所谓的挤压和激励（Squeeze-and-Excitation）操作是作为一个单元添加到传统的卷积网络结构中，如残差单元中(后面我会把修改好的残差单元给大家大家直接复制粘贴即可使用)亲测大中小三中目标检测上都有一定程度的涨点效果。阅读全文

posted @ 2024-01-16 00:06 Snu77 阅读(354) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 利用MobileNetV3替换Backbone（轻量化网络结构）

摘要：本文给大家带来的改进机制是MobileNetV3，其主要改进思想集中在结合硬件感知的网络架构搜索（NAS）和NetAdapt算法，以优化移动设备CPU上的性能。它采用了新颖的架构设计，包括反转残差结构和线性瓶颈层，以及新的高效分割解码器Lite Reduced Atrous Spatial Pyramid Pooling（LR-ASPP），以提升在移动分类、检测和分割任务上的表现。实验表明，MobileNets在资源和准确性的权衡方面表现出色，并在多种应用（如对象检测、细粒度分类、面部属性识别和大规模地理定位）中展现了其有效性。阅读全文

posted @ 2024-01-16 00:06 Snu77 阅读(1218) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 利用MobileNetV2替换Backbone（轻量化网络结构）

摘要：本文给大家带来的改进机制是MobileNetV2，其是专为移动和嵌入式视觉应用设计的轻量化网络结构。其在MobilNetV1的基础上采用反转残差结构和线性瓶颈层。这种结构通过轻量级的深度卷积和线性卷积过滤特征，同时去除狭窄层中的非线性，以维持表征能力。MobileNetV2在性能上和精度上都要比V1版本强很多，其在多种应用（如对象检测、细粒度分类、面部属性识别和大规模地理定位）中都展现了一定的有效性。阅读全文

posted @ 2024-01-16 00:07 Snu77 阅读(871) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 利用MobileNetV1替换Backbone（轻量化网络结构）

摘要：本文给大家带来的改进机制是MobileNetV1，其是专为移动和嵌入式视觉应用设计的轻量化网络结构。这些模型基于简化的架构，并利用深度可分离卷积构建轻量级深度神经网络，其引入了两个简单的全局超参数，用于在延迟和准确性之间进行有效的权衡。实验表明，MobileNets在资源和准确性的权衡方面表现出色，并在多种应用（如对象检测、细粒度分类、面部属性识别和大规模地理定位）中展现了其有效性，这个模型非常适合轻量化的读者来使用。阅读全文

posted @ 2024-01-16 00:08 Snu77 阅读(212) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 轻量级网络ShuffleNetV1（附代码+修改教程）

摘要：本文给大家带来的改进内容是ShuffleNetV1，这是一种为移动设备设计的高效CNN架构。它通过使用点群卷积和通道混洗等操作，减少了计算成本，同时保持了准确性，通过这些技术，ShuffleNet在降低计算复杂度的同时，也优化了内存使用，使其更适合低功耗的移动设备(我在YOLOv8n上修改该主干计算量仅为2GFLOPs,但是参数量还是有一定上涨，其非常适合轻量化的读者来使用)。本文通过介绍其主要框架原理，然后教你如何添加该网络结构到网络模型中。阅读全文

posted @ 2024-01-16 00:09 Snu77 阅读(475) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 轻量级网络ShuffleNetV2（附代码+修改教程）

摘要：本文给大家带来的改进内容是ShuffleNetV2，这是一种为移动设备设计的高效CNN架构。其在ShuffleNetV1的基础上强调除了FLOPs之外，还应考虑速度、内存访问成本和平台特性。(我在YOLOv8n上修改该主干降低了GFLOPs,但是参数量还是有一定上涨，其非常适合轻量化的读者来使用,同时精度也有一定程度的上涨)。本文通过介绍其主要框架原理，然后教你如何添加该网络结构到网络模型中。阅读全文

posted @ 2024-01-16 00:10 Snu77 阅读(716) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | 华为最新VanillaNet主干替换Backbone实现大幅度长点

摘要：本文给大家来的改进机制是华为最新VanillaNet网络，其是今年最新推出的主干网络，VanillaNet是一种注重极简主义和效率的神经网络架构。它的设计简单，层数较少，避免了像深度架构和自注意力这样的复杂操作(需要注意的是该网络结构的通道数会被放大，GFLOPs的量会很高)。我将其替换整个YOLOv8的Backbone，在一些大目标和小目标检测上均有涨点，效果比上一篇RepViT的效果要好。我的实验数据集是一个包含1000张图片包含大中小的检测目标的数据集上(共有20+类别)，下面我会附上基础版本和修改版本的训练对比图，同时我会手把手教你添加该网络结构。阅读全文

posted @ 2024-01-16 00:11 Snu77 阅读(332) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器（ViT）的视角重新审视CNN

摘要：本文给大家来的改进机制是RepViT，用其替换我们整个主干网络，其是今年最新推出的主干网络，其主要思想是将轻量级视觉变换器（ViT）的设计原则应用于传统的轻量级卷积神经网络(CNN)。我将其替换整个YOLOv8的Backbone，实现了大幅度涨点。我对修改后的网络(我用的最轻量的版本)，在一个包含1000张图片包含大中小的检测目标的数据集上(共有20+类别)，进行训练测试，发现所有的目标上均有一定程度的涨点效果，下面我会附上基础版本和修改版本的训练对比图。阅读全文

posted @ 2024-01-16 00:12 Snu77 阅读(352) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | 替换LSKNet遥感目标检测主干 (附代码+修改教程+结构讲解)

摘要：本文给大家带来的改进内容是LSKNet（Large Kernel Selection, LK Selection），其是一种专为遥感目标检测设计的网络架构，其核心思想是动态调整其大的空间感受野，以更好地捕捉遥感场景中不同对象的范围上下文。实验部分我在一个包含三十多个类别的数据集上进行实验，其中包含大目标检测和小目标检测，mAP的平均涨点幅度在0.04-0.1之间(也有极个别的情况没有涨点)，同时官方的版本只提供了一个大版本，我在其基础上提供一个轻量化版本给大家选择，本文会先给大家对比试验的结果，供大家参考。阅读全文

posted @ 2024-01-16 00:12 Snu77 阅读(814) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | 利用轻量化卷积优化PP-HGNetV2改进主干（全网独家创新）

摘要：Hello，大家好，上一篇博客我们讲了利用HGNetV2去替换YOLOv8的主干，经过结构的研究我们可以发现在HGNetV2的网络中有大量的卷积存在，所以我们可以用一种更加轻量化的卷积去优化HGNetV2从而达到更加轻量化的效果（亲测优化后的HGNetV2网络比正常HGNetV2精度更高轻量化效果更好，非常适合轻量化的读者），同时HGNetV2的网络结构目前还没有推出论文，所以其理论知识在网络上也是非常的少，我也是根据网络结构图进行了分析，给大家进行讲解网络结构原理（亲测替换之后主干GFLOPs降低到7.4，精度mAP提高0.06）。阅读全文

posted @ 2024-01-16 00:13 Snu77 阅读(1004) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | 利用RT-DETR特征提取网络PPHGNetV2改进YOLOv8（超级轻量化精度更高）

摘要：本文给大家带来利用RT-DETR模型主干HGNet去替换YOLOv8的主干，RT-DETR是今年由百度推出的第一款实时的ViT模型，其在实时检测的领域上号称是打败了YOLO系列，其利用两个主干一个是HGNet一个是ResNet，其中HGNet就是我们今天来讲解的网络结构模型（亲测这个HGNet网络比YOLO的主干更加轻量化和精度更高的主干，非常适合轻量化研究的读者），这个网络结构目前还没有推出论文，所以其理论知识在网络上也是非常的少，我也是根据网络结构图进行了分析（亲测替换之后主干GFLOPs降低到7.7，精度mAP提高0.05）。阅读全文

posted @ 2024-01-16 00:14 Snu77 阅读(338) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | SwinTransformer替换Backbone（附代码 + 详细修改步骤 +原理介绍）

摘要：本文给大家带来的改进机制是利用Swin Transformer替换YOLOv8中的骨干网络其是一个开创性的视觉变换器模型，它通过使用位移窗口来构建分层的特征图，有效地适应了计算机视觉任务。与传统的变换器模型不同，Swin Transformer的自注意力计算仅限于局部窗口内，使得计算复杂度与图像大小成线性关系，而非二次方。这种设计不仅提高了模型的效率，还保持了强大的特征提取能力。Swin Transformer的创新在于其能够在不同层次上捕捉图像的细节和全局信息，使其成为各种视觉任务的强大通用骨干网络。亲测在小目标检测和大尺度目标检测的数据集上都有涨点效果。阅读全文

posted @ 2024-01-16 00:15 Snu77 阅读(1224) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | EfficientViT替换Backbone（高效的视觉变换网络）

摘要：本文给大家带来的改进机制是EfficientViT（高效的视觉变换网络），EfficientViT的核心是一种轻量级的多尺度线性注意力模块，能够在只使用硬件高效操作的情况下实现全局感受野和多尺度学习。本文带来是2023年的最新版本的EfficientViT网络结构，论文题目是'EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction'这个版本的模型结构(这点大家需要注意以下)。同时本文通过介绍其模型原理，然后手把手教你添加到网络结构中去，最后提供我完美运行的记录，如果大家运行过程中的有任何问题，都可以评论区留言，我都会进行回复。亲测在小目标检测和大尺度目标检测的数据集上都有大幅度的涨点效果(mAP直接涨了大概有0.1左右) 阅读全文

posted @ 2024-01-16 00:16 Snu77 阅读(338) 评论(0) 推荐(0)

YOLOv8改进 | 2023主干篇 | FasterNeT跑起来的主干网络（提高FPS和检测效率）

摘要：本文给大家带来的改进机制是FasterNet网络，将其用来替换我们的特征提取网络，其旨在提高计算速度而不牺牲准确性，特别是在视觉任务中。它通过一种称为部分卷积（PConv）的新技术来减少冗余计算和内存访问。这种方法使得FasterNet在多种设备上运行速度比其他网络快得多，同时在各种视觉任务中保持高准确率。经过我的实验该主干网络确实能够涨点在大中小三种物体检测上，同时该主干网络也提供多种版本，大家可以在源代码中进行修改版本的使用。本文通过介绍其主要框架原理，然后教大家如何添加该网络结构到网络模型中。阅读全文

posted @ 2024-01-16 00:16 Snu77 阅读(600) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | EfficientNetV2均衡缩放网络改进特征提取层

摘要：这次给大家带来的改进机制是EfficientNetV2，其在其V1版本通过均衡地缩放网络的深度、宽度和分辨率，以提高卷积神经网络的性能的基础上，又提出了一种改进的渐进式学习方法，通过在训练过程中逐步增加图像尺寸并适应性调整正则化来加快训练速度，同时保持准确性。所以其相对于V1版本的改进主要是在速度和效率上的改进(但是经过我实验我觉得V2不如V1快，可能是我使用的不是同一等级的版本，大家也可以进行一下对比)。本文通过介绍其主要框架原理，然后教大家如何添加该网络结构到网络模型中。阅读全文

posted @ 2024-01-16 00:17 Snu77 阅读(630) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | CSWinTransformer交叉形窗口网络

摘要：本文给大家带来的改进机制是CSWin Transformer，其基于Transformer架构，创新性地引入了交叉形窗口自注意力机制，用于有效地并行处理图像的水平和垂直条带，形成交叉形窗口以提高计算效率。它还提出了局部增强位置编码（LePE），更好地处理局部位置信息，我将其替换YOLOv8的特征提取网络，用于提取更有用的特征。经过我的实验该主干网络确实能够涨点在大中小三种物体检测上，同时该主干网络也提供多种版本，大家可以在源代码中进行修改版本的使用。本文通过介绍其主要框架原理，然后教大家如何添加该网络结构到网络模型中。阅读全文

posted @ 2024-01-16 18:26 Snu77 阅读(346) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | ConvNeXtV2全卷积掩码自编码器网络

摘要：本文给大家带来的改进机制是ConvNeXtV2网络，ConvNeXt V2是一种新型的卷积神经网络架构，它融合了自监督学习技术和架构改进，特别是加入了全卷积掩码自编码器框架和全局响应归一化（GRN）层。我将其替换YOLOv8的特征提取网络，用于提取更有用的特征。经过我的实验该主干网络确实能够涨点在大中小三种物体检测上，同时该主干网络也提供多种版本，大家可以在源代码中进行修改版本的使用。本文通过介绍其主要框架原理，然后教大家如何添加该网络结构到网络模型中。阅读全文

posted @ 2024-01-16 18:26 Snu77 阅读(1023) 评论(0) 推荐(0)

YOLOv8改进 | 主干篇 | 12月份最新成果TransNeXt特征提取网络（全网首发）

摘要：本文给大家带来的改进机制是TransNeXt特征提取网络,其发表于2023年的12月份是一个最新最前沿的网络模型，将其应用在我们的特征提取网络来提取特征，同时本文给大家解决其自带的一个报错，通过结合聚合的像素聚焦注意力和卷积GLU，模拟生物视觉系统，特别是对于中心凹的视觉感知。这种方法使得每个像素都能实现全局感知，并强化了模型的信息混合和自然视觉感知能力。TransNeXt在各种视觉任务中，包括图像分类、目标检测和语义分割，都显示出优异的性能(该模型的训练时间很长这是需要大家注意的)。阅读全文

posted @ 2024-01-16 18:28 Snu77 阅读(301) 评论(0) 推荐(0)

YOLOv8改进 | 2023检测头篇 | 利用AFPN改进检测头适配YOLOv8版（全网独家创新）

摘要：本文给大家带来的改进机制是利用今年新推出的AFPN（渐近特征金字塔网络）来优化检测头，AFPN的核心思想是通过引入一种渐近的特征融合策略，将底层、高层和顶层的特征逐渐整合到目标检测过程中。这种渐近融合方式有助于减小不同层次特征之间的语义差距，提高特征融合效果，使得检测模型能更好地适应不同层次的语义信息。本文在AFPN的结构基础上，为了适配YOLOv8改进AFPN结构，同时将AFPN融合到YOLOv8中(因为AFPN需要四个检测头，我们只有三个，下一篇文章我会出YOLOv8适配AFPN增加小目标检测头)实现暴力涨点。阅读全文

posted @ 2024-01-16 18:29 Snu77 阅读(330) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | 给YOLOv8换个RT-DETR的检测头（重塑目标检测前沿技术）

摘要：本文给大家带来是用最新的RT-DETR模型的检测头去替换YOLOv8中的检测头。RT-DETR号称是打败YOLO的检测模型，其作为一种基于Transformer的检测方法，相较于传统的基于卷积的检测方法，提供了更为全面和深入的特征理解，将RT-DETR检测头融入YOLOv8，我们可以结合YOLO的实时检测能力和RT-DETR的深度特征理解能力，打造出一个更加强大的目标检测模型。亲测这一整合不仅提高了模型在复杂场景下的表现，还显著提升了对小目标和遮挡目标的检测能力。此外，模型在多种标准数据集上的表现也有了明显提升，特别是在处理高动态范围和复杂背景的图像时，其表现尤为出色。阅读全文

posted @ 2024-01-16 18:35 Snu77 阅读(883) 评论(0) 推荐(0)

YOLOv8改进 | 2023检测头篇 | 利用AFPN增加小目标检测层(让小目标无所遁形)

摘要：本文给大家带来的改进机制是利用今年新推出的AFPN（渐近特征金字塔网络）来优化检测头，AFPN的核心思想是通过引入一种渐近的特征融合策略，将底层、高层和顶层的特征逐渐整合到目标检测过程中。这种渐近融合方式有助于减小不同层次特征之间的语义差距，提高特征融合效果，使得检测模型能更好地适应不同层次的语义信息。之前答应大家说出一个四头版本的Detect_FPN本文就是该检测头，利用该检测头实现暴力涨点，让小目标无所遁形，同时该机制改完之后参数量仅有210w。同时欢迎大家订阅本专栏，本专栏每周更新3-5篇最新机制，更有包含我所有改进的文件和交流群提供给大家。阅读全文

posted @ 2024-01-16 18:36 Snu77 阅读(1034) 评论(0) 推荐(0)

YOLOv8改进 | 检测头篇 | ASFF改进YOLOv8检测头（全网首发）

摘要：本文给大家带来的改进机制是利用ASFF改进YOLOv8的检测头形成新的检测头Detect_ASFF，其主要创新是引入了一种自适应的空间特征融合方式，有效地过滤掉冲突信息，从而增强了尺度不变性。经过我的实验验证，修改后的检测头在所有的检测目标上均有大幅度的涨点效果，此版本为三头版本，后期我会在该检测头的基础上进行二次创新形成四头版本的Detect_ASFF助力小目标检测，本文的检测头非常推荐大家使用。阅读全文

posted @ 2024-01-16 18:37 Snu77 阅读(871) 评论(0) 推荐(0)

YOLOv8改进 | 检测头篇 | DynamicHead原论文一比一复现（不同于网上版本，全网首发）

摘要：本文给大家带来的改进机制是DynamicHead(Dyhead)，这个检测头由微软提出的一种名为“动态头”的新型检测头，用于统一尺度感知、空间感知和任务感知。网络上关于该检测头我查了一些有一些魔改的版本，但是我觉得其已经改变了该检测头的本质，因为往往一些细节上才能决定好的效果，我将官方的代码移植到了YOLOv8进行实验，同时该检测头有一些使用细节需要注意，成功实现了大幅度的涨点，mAP涨了百分之三十以上！！！所以检测头对于模型的精度提升是非常大的，同时该检测头有二次创新和三次创新的机会后期我也会发布在群里大家可以关注一下，同时本检测头发布的版本不同于网络上的其他魔改版本不要用其它版本的效果来对比我的检测头，欢迎大家订阅我的专栏一起学习YOLO！阅读全文

posted @ 2024-01-16 18:38 Snu77 阅读(5700) 评论(0) 推荐(0)

YOLOv8改进 | 检测头篇 | 独创FRMHead效果秒杀v8和RT-DETR检测头 (全网独家首发)

摘要：本文给大家带来的改进机制是，FRMHead检测头，其是由我独家创新，全网首发，效果秒杀之前的其它检测头，将其替换我们的YOLOv8的检测头，mAP提高百分之二十以上接近百分之三十，recall提高百分之二十，mAP50-95提高也接近百分之二十，可以说其效果是十分有效的，大家拿到以后可以将其和我发的其它的机制选一个主干一个Neck，做几次实验涨点效果就十分明显，就可以产出一篇论文，大家会发现检测头对于模型的精度提升是非常大的(但是其也是非常的难改的，网络上的关于检测头的改进十分少)，同时该检测头有二次创新的机会后期我也会发布在群里大家可以关注一下，欢迎大家订阅我的专栏一起学习YOLO 阅读全文

posted @ 2024-01-16 18:39 Snu77 阅读(409) 评论(0) 推荐(0)

YOLOv8改进 | 检测头篇 | CLLAHead分布焦点检测头（全网独创首发）

摘要：本文给大家带来的改进机制是CLLAHead，该检测头为我独家全网首发，该检测头通过多层次的特征提取和整合，利用分布焦点损失损失函数和一种注意力机制，来提高对图像中目标的识别和定位能力。这种结构特别适合于处理复杂的图像场景，其中包含多个不同大小和形状的目标，同时该检测头的参数量非常微量(之前发的一个检测头大家说参数量大，这次发一个参数量小的)。同时欢迎大家订阅本专栏，本专栏每周更新3-5篇最新机制，更有包含我所有改进的文件和交流群提供给大家。欢迎大家订阅我的专栏一起学习YOLO！阅读全文

posted @ 2024-01-16 18:39 Snu77 阅读(258) 评论(0) 推荐(0)

YOLOv8改进 | 2023Neck篇 | 轻量级跨尺度特征融合模块CCFM（附yaml文件+添加教程）

摘要：本文给大家带来的改进机制是轻量级跨尺度特征融合模块CCFM（Cross-Scale Feature Fusion Module）其主要原理是：将不同尺度的特征通过融合操作整合起来，以增强模型对于尺度变化的适应性和对小尺度对象的检测能力。我将其复现在YOLOv8上，发现其不仅能够降低GFLOPs（成功添加之后，不引入任何其它模块GFLOPs降低至7.3），同时精度上也有很大幅度的提升mAP大概能够提高0.05左右，相对于BiFPN也有一定幅度的上涨。阅读全文

posted @ 2024-01-16 18:41 Snu77 阅读(395) 评论(0) 推荐(0)

YOLOv8改进 | 2023Neck篇 | 利用Damo-YOLO的RepGFPN改进特征融合层

摘要：本文给大家带来的改进机制是Damo-YOLO的RepGFPN（重参数化泛化特征金字塔网络），利用其优化YOLOv8的Neck部分，可以在不影响计算量的同时大幅度涨点（亲测在小目标和大目标检测的数据集上效果均表现良好涨点幅度超级高！）。RepGFPN不同于以往提出的改进模块，其更像是一种结构一种思想(一种处理事情的方法)，RepGFPN相对于BiFPN和之前的FPN均有一定程度上的优化效果。阅读全文

posted @ 2024-01-16 18:42 Snu77 阅读(480) 评论(0) 推荐(0)

YOLOv8改进 | 2023Neck篇 | BiFPN双向特征金字塔网络（附yaml文件+代码）

摘要：本文给大家带来的改进机制是BiFPN双向特征金字塔网络，其是一种特征融合层的结构，也就是我们本文改进YOLOv8模型中的Neck部分，它的主要思想是通过多层级的特征金字塔和双向信息传递来提高精度。本文给大家带来的结构可以让大家自行调节网络结构大小，同时能够达到一定的轻量化效果(需要注意的是BiFPN正常是需要五个检测头的，但是YOLOv8只有三个检测头，所以我对其yaml文件进行了一定设计，从而支持三个头的检测，后面我也会出四个头的BiFPN，然后配合我前面的AFPN_Detect检测头来融合)。阅读全文

posted @ 2024-01-16 18:43 Snu77 阅读(1014) 评论(0) 推荐(0)

YOLOv8改进 | Neck篇 | Slim-Neck替换特征融合层实现超级涨点 (又轻量又超级涨点)

摘要：本文给大家带来的改进机制是Slim-neck提出的Neck部分，Slim-neck是一种设计用于优化卷积神经网络中neck部分的结构。在我们YOLOv8中，neck是连接主干网络（backbone）和头部网络（head）的部分，负责特征融合和处理，以便提高检测的准确性和效率。亲测在小目标检测和大尺度目标检测的数据集上都有大幅度的涨点效果(mAP直接涨了大概有0.4左右。同时本文对Slim-Neck的框架原理进行了详细的分析，不光让大家会添加到自己的模型在写论文的时候也能够有一定的参照，最后本文会手把手教你添加Slim-Neck模块到网络结构中(值得一提的是这个Slim-neck还可以减少GFLOPs大概2修改完大概是8.0GFLOP所以非常适合轻量化的读者)。阅读全文

posted @ 2024-01-16 18:45 Snu77 阅读(641) 评论(0) 推荐(0)

YOLOv8改进 | 2023Neck篇 | 利用Gold-YOLO改进YOLOv8对小目标检测

摘要：本文给大家带来的改进机制是Gold-YOLO利用其Neck改进v8的Neck，GoLd-YOLO引入了一种新的机制——信息聚集-分发（Gather-and-Distribute, GD）。这个机制通过全局融合不同层次的特征并将融合后的全局信息注入到各个层级中，从而实现更高效的信息交互和融合。这种方法增强了模型的颈部（neck）信息融合能力(有点类似于长颈鹿的脖子该Neck部分很长)，同时也没有显著增加延迟，提高了模型在检测不同大小物体时的性能，同时欢迎大家订阅本专栏，本专栏每周更新3-5篇最新机制，更有包含我所有改进的文件和交流群提供给大家，同时在这里再次声明，我本人发的对比图片全部真实有效，为对应文章的模型运行结果。阅读全文

posted @ 2024-01-16 18:45 Snu77 阅读(775) 评论(0) 推荐(0)

YOLOv8改进 | Neck篇 | 利用ASF-YOLO改进特征融合层（适用于分割和目标检测）

摘要：本文给大家带来的改进机制是ASF-YOLO（发布于2023.12月份的最新机制），其是特别设计用于细胞实例分割。这个模型通过结合空间和尺度特征，提高了在处理细胞图像时的准确性和速度。在实验中，ASF-YOLO在2018年数据科学竞赛数据集上取得了卓越的分割准确性和速度，达到了0.91的box mAP（平均精度），0.887的mask mAP，以及47.3 FPS的推理速度，效果非常的好，这个结构本来是用于分割的，我将其移植到了目标检测的模型上，所以其可以适用于分割和目标检测，当然其它的领域也可以用但是对于分割的同学效果是最好的，目标检测领域也有一定涨点效果，同时欢迎大家订阅本专栏，本专栏每周更新3-5篇最新机制，更有包含我所有改进的文件和交流群提供给大家。阅读全文

posted @ 2024-01-16 18:46 Snu77 阅读(898) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | MPDIoU、InnerMPDIoU助力细节涨点

摘要：本文为读者详细介绍了YOLOv8模型的最新改进，带来的改进机制是最新的损失函数MPDIoU和融合了最新的Inner思想的InnerMPDIoU(效果打爆之前的所有的损失函数)提升检测精度和处理细节方面的作用。通过深入探讨MPDIoU和InnerMPDIoU(全网首发)的工作原理和实际代码实现，本文旨在指导读者如何将这些先进的损失函数技术应用到YOLOv8模型中，以提高其性能和准确性。文章内容涵盖从理论基础、代码实现，到实际教你如何添加本文的机制到你的模型中。阅读全文

posted @ 2024-01-16 18:48 Snu77 阅读(490) 评论(0) 推荐(0)

YOLOv8改进 | EIoU、SIoU、WIoU、DIoU、FocusIoU等二十余种损失函数

摘要：这篇文章介绍了YOLOv8的重大改进，特别是在损失函数方面的创新。它不仅包括了多种IoU损失函数的改进和变体，如SIoU、WIoU、GIoU、DIoU、EIOU、CIoU，还融合了“Focus”思想，创造了一系列新的损失函数。这些组合形式的损失函数超过了二十余种，每种都针对特定的目标检测挑战进行优化。文章会详细探讨这些损失函数如何提高YOLOv8在各种检测任务中的性能，包括提升精度、加快收敛速度和增强模型对复杂场景的适应性。本文章主要是为了发最近新出的Inner思想改进的各种EIoU的文章服务，其中我经过实验在绝大多数下的效果都要比本文中提到的各种损失效果要好。阅读全文

posted @ 2024-01-16 18:49 Snu77 阅读(3685) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | InnerIoU、InnerSIoU、InnerWIoU、FocusIoU等损失函数

摘要：本文给大家带来的是YOLOv8最新改进，为大家带来最近新提出的InnerIoU的内容同时用Inner的思想结合SIoU、WIoU、GIoU、DIoU、EIOU、CIoU等损失函数，形成 InnerIoU、InnerSIoU、InnerWIoU、等新版本损失函数，同时还结合了Focus和AIpha思想，形成的新的损失函数，其中Inner的主要思想是：引入了不同尺度的辅助边界框来计算损失，(该方法在处理非常小目标的检测任务时表现出良好的性能(但是在其它的尺度检测时也要比普通的损失要好)。文章会详细探讨这些损失函数如何提高YOLOv8在各种检测任务中的性能，包括提升精度、加快收敛速度和增强模型对复杂场景的适应性。阅读全文

posted @ 2024-01-16 18:50 Snu77 阅读(1284) 评论(0) 推荐(0)

YOLOv8改进 | 损失篇 | VarifocalLoss密集检测专用损失函数 (VFLoss，论文一比一复现)

摘要：本文给大家带来的是损失函数改进VFLoss损失函数，VFL是一种为密集目标检测器训练预测IoU-aware Classification Scores（IACS）的损失函数，我经过官方的版本将其集成在我们的YOLOv8的损失函数使用上，其中有很多使用的小细节(否则按照官方的版本使用根本拟合不了，这也是为啥网上的版本拟合不了的原因，其中需要设置一些参数)，后面我也会给大家讲解到底模型改到什么地步的时候引入损失函数改进，同时在开始讲解之前推荐一下我的专栏，本专栏的内容支持(分类、检测、分割、追踪、关键点检测),专栏目前为限时折扣，欢迎大家订阅本专栏，本专栏每周更新3-5篇最新机制，更有包含我所有改进的文件和交流群提供给大家。阅读全文

posted @ 2024-01-16 18:56 Snu77 阅读(1578) 评论(0) 推荐(0)

YOLOv8改进 | 损失函数篇 | SlideLoss、FocalLoss分类损失函数助力细节涨点(全网最全)

摘要：本文给大家带来的是分类损失 SlideLoss、VFLoss、FocalLoss损失函数，我们之前看那的那些IoU都是边界框回归损失，和本文的修改内容并不冲突，所以大家可以知道损失函数分为两种一种是分类损失另一种是边界框回归损失，上一篇文章里面我们总结了过去百分之九十的边界框回归损失的使用方法，本文我们就来介绍几种市面上流行的和最新的分类损失函数，同时在开始讲解之前推荐一下我的专栏，本专栏的内容支持(分类、检测、分割、追踪、关键点检测),专栏目前为限时折扣，欢迎大家订阅本专栏，本专栏每周更新3-5篇最新机制，更有包含我所有改进的文件和交流群提供给大家，本文支持的损失函数共有如下图片所示欢迎大家订阅我的专栏一起学习YOLO！阅读全文

posted @ 2024-01-16 18:57 Snu77 阅读(1011) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | 将RT-DETR模型AIFI模块和Conv模块结合替换SPPF（全网独家改进）

摘要：本文给大家带来是用最新的RT-DETR模型中的AIFI模块间去替换YOLOv8中的SPPF。RT-DETR号称是打败YOLO的检测模型，其作为一种基于Transformer的检测方法，相较于传统的基于卷积的检测方法，提供了更为全面和深入的特征理解，将RT-DETR中的一些先进模块融入到YOLOv8往往能够达到一些特殊的效果（我个人猜测，所以我进行了一些实验来验证这一点），我将RT-DETR的AIFI模块和Conv模块融合在一起添加到了YOLOv8中。亲测这一改进并不一定能够提高精度我用了三个数据集来试(没有涨点就是没有涨点，我不能够没有涨点还去告诉你涨点这样也耽误大家的时间)，但为啥要发出来这个AIFI首先其能够达到轻量化模型的作用的，其次其能够和RT-DETR模型的其他模块融合可以达到好的效果。所以发出来想要给的是轻量化读者来使用的，因为发论文并不一定要提高精度轻量化模型也是一个方向。阅读全文

posted @ 2024-01-16 18:58 Snu77 阅读(852) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | FocalModulation替换SPPF（精度更高的空间金字塔池化）

摘要：本文给大家带来的改进是用FocalModulation技术来替换了原有的SPPF（快速空间金字塔池化）模块。FocalModulation是今年新提出的特征增强方法，它利用注意力机制来聚焦于图像中的关键区域，从而提高模型对这些区域的识别能力。与SPPF相比，FocalModulation不仅能够处理不同尺寸的输入图像，还能更精确地识别和定位图像中的对象。这一技术特别适用于处理那些难以检测的小对象或在复杂背景中的对象（更多的检测效果请看第二章）。我进行了简单的实验，这个FocalModulation能够提升一定的精度，其不影响任何的计算量和参数所以还是可以尝试的(改进起来也比较简单)。阅读全文

posted @ 2024-01-16 18:58 Snu77 阅读(787) 评论(0) 推荐(0)

YOLOv8改进 | 细节创新篇 | iAFF迭代注意力特征融合助力多目标细节涨点

摘要：本文给大家带来的改进机制是iAFF（迭代注意力特征融合），其主要思想是通过改善特征融合过程来提高检测精度。传统的特征融合方法如加法或串联简单，未考虑到特定对象的融合适用性。iAFF通过引入多尺度通道注意力模块(我个人觉得这个改进机制就算融合了注意力机制的求和操作)，更好地整合不同尺度和语义不一致的特征。该方法属于细节上的改进，并不影响任何其它的模块，非常适合大家进行融合改进，单独使用也是有一定的涨点效果。阅读全文

posted @ 2024-01-16 18:59 Snu77 阅读(412) 评论(0) 推荐(0)

YOLOv8改进 | 2023 | CARAFE提高精度的上采样方法（助力细节长点）

摘要：本文给大家带来的CARAFE（Content-Aware ReAssembly of FEatures）是一种用于增强卷积神经网络特征图的上采样方法。其主要旨在改进传统的上采样方法（就是我们的Upsample）的性能。CARAFE的核心思想是：使用输入特征本身的内容来指导上采样过程，从而实现更精准和高效的特征重建。CARAFE是一种即插即用的上采样机制其本身并没有任何的使用限制，特别是在需要精细上采样的场景中，如图像超分辨率、语义分割等。这种方法改善了上采样过程中的细节保留和重建质量，使网络能够生成更清晰、更准确的输出。所以在YOLOv8的改进中其也可以做到一个提高精度的改进方法。阅读全文

posted @ 2024-01-16 19:09 Snu77 阅读(548) 评论(0) 推荐(0)

YOLOv8改进 | 融合改进篇 | BiFPN+ RepViT（教你如何融合改进机制）

摘要：本文给大家带来的改进机制是融合改进，最近有好几个读者和我反应单独的机制都能够涨点，一融合起来就掉点，这是大家不了解其中的原理(这也是为什么我每一个机制都给大家讲解一下原理，大家要明白其中的每个单独的机制涨点原理然后才能够更好的融合，有一些结构是有冲突的)，不知道哪些模块和那些模块融合起来才能够涨点。所以本文给大家带来的改进机制是融合 BiFPN+ RepViT的融合改进机制，实现大幅度涨点进行二次创新。阅读全文

posted @ 2024-01-16 19:17 Snu77 阅读(1815) 评论(0) 推荐(0)

合集-YOLOv8改进

导航

公告