随笔分类 -  计算机视觉

摘要:前言:上次讲了YOLOv3中的模型构建,从头到尾理了一遍从cfg读取到模型整个构建的过程。其中模型构建中最重要的YOLOLayer还没有梳理,本文将从代码的角度理解YOLOLayer的构建与实现。 1. Grid创建 YOLOv3是一个单阶段的目标检测器,将目标划分为不同的grid,每个grid分配 阅读全文
posted @ 2020-01-22 17:15 pprp 阅读(2342) 评论(5) 推荐(1)
摘要:前言: 本文介绍了一个用于语义分割领域的attention模块scSE。scSE模块与之前介绍的BAM模块很类似,不过在这里scSE模块只在语义分割中进行应用和测试,对语义分割准确率带来的提升比较大。 提出scSE模块论文的全称是:《 Concurrent Spatial and Channel ‘ 阅读全文
posted @ 2020-01-16 11:26 pprp 阅读(4015) 评论(0) 推荐(1)
摘要:前言: 之前已经介绍过SENet和Non Local Neural Network(NLNet),两者都是有效的注意力模块。作者发现NLNet中attention maps在不同位置的响应几乎一致,并结合SENet后,提出了Global Context block,用于全局上下文建模,在主流的ben 阅读全文
posted @ 2020-01-16 10:28 pprp 阅读(3614) 评论(0) 推荐(1)
摘要:1. Non local Non Local是王小龙在CVPR2018年提出的一个自注意力模型。Non Local Neural Network和Non Local Means非局部均值去燥滤波有点相似的感觉。普通的滤波都是3×3的卷积核,然后在整个图片上进行移动,处理的是3×3局部的信息。Non 阅读全文
posted @ 2020-01-16 10:01 pprp 阅读(20698) 评论(0) 推荐(1)
摘要:前言: 与其他框架不同,Darknet构建网络架构不是通过代码直接堆叠,而是通过解析cfg文件进行生成的。cfg文件格式是有一定规则,虽然比较简单,但是有些地方需要对yolov3有一定程度的熟悉,才能正确设置。 下边以 yolov3.cfg 为例进行讲解。 作者:pprp 首发:GiantPanda 阅读全文
posted @ 2020-01-16 09:47 pprp 阅读(7565) 评论(1) 推荐(1)
摘要:1. Non local Non Local是王小龙在CVPR2018年提出的一个自注意力模型。Non Local NN和Non Local Means非局部均值去燥滤波有点相似的感觉。普通的滤波都是3×3的卷积核,然后在整个图片上进行移动,处理的是3×3局部的信息。Non Local Means操 阅读全文
posted @ 2020-01-05 19:02 pprp 阅读(12521) 评论(5) 推荐(4)
摘要:+ 1. BAM BAM全程是bottlenect attention module,与CBAM很相似的起名,还是CBAM的团队完成的作品。 CBAM被ECCV18接受,BAM被BMVC18接收。 CBAM可以看做是通道注意力机制和空间注意力机制的串联(先通道后空间),BAM可以看做两者的并联。 这 阅读全文
posted @ 2020-01-03 20:46 pprp 阅读(4022) 评论(0) 推荐(1)
摘要:前言:让我惊艳的几个库: 1. ultralytics的yolov3,在一众yolov3的pytorch版本实现算法中脱颖而出,收到开发人员的欢迎,比别的库明显好的点在于,与darknet相似度达到极高的水平,支持自定义cfg文件的加载,简直完美。 2. michuanhaohao的reid str 阅读全文
posted @ 2019-11-10 17:02 pprp 阅读(4994) 评论(0) 推荐(0)
摘要:接触python有一段时间了,从开始的看菜鸟的python教程,看了一些视频,一些书。很多人感觉python很简单,确实相比其他语言,python可能稍微简单一点,但是不能说只学了python基础语法就说自己python水平可以了。最近在阅读YOLOv3的pytorch版本源码,就遇到很多瓶颈,很多是与python相关的。所以这篇进行总结一下,收集一下所有的问题,更深入理解python高阶用法,并且尽量每个都附上例子,做一个认真的coder,bloger。 阅读全文
posted @ 2019-10-22 21:35 pprp 阅读(5322) 评论(0) 推荐(0)
摘要:[TOC] 1. ResNet理论 论文: 残差学习基本单元: 在ImageNet上的结果: 效果会随着模型层数的提升而下降,当更深的网络能够开始收敛时,就会出现降级问题:随着网络深度的增加,准确度变得饱和(这可能不足为奇),然后迅速降级。 ResNet模型: 2. pytorch实现 2.1 基础 阅读全文
posted @ 2019-10-22 18:26 pprp 阅读(3756) 评论(0) 推荐(0)
摘要:1. 基础知识 1.1 条件概率 一个事件概率依赖于另外一个事件(已发生)的度量。 $P(B|A)$的意义是在A发生的情况下B事件发生的概率。这就是条件概率。 $P(AB) = P(A) \times P(B|A)​$ 代表的意义是,AB事件同时发生的概率等于事件A发生的概率乘以在A发生条件下B事件 阅读全文
posted @ 2019-07-26 15:43 pprp 阅读(529) 评论(0) 推荐(0)
摘要:1. 四种情况 Precision精确率, Recall召回率,是二分类问题常用的评价指标。混淆矩阵如下: T和F代表True和False,是形容词,代表预测是否正确。 P和N代表Positive和Negative,是预测结果。 | | 预测结果为阳性 Positive | 预测结果为假阳性 Neg 阅读全文
posted @ 2019-07-25 08:02 pprp 阅读(51735) 评论(7) 推荐(1)
摘要:如何访问tensorflow官方网站 tensorflow官方网站变为: 安装深度学习框架 0. ubuntu查看CUDA和cuDNN版本 CUDA: cuDNN: 1. keras | 版本 | Python 版本 | 编译器 | 编译工具 | cuDNN | CUDA | | | | | | | 阅读全文
posted @ 2019-07-16 18:04 pprp 阅读(828) 评论(0) 推荐(1)
摘要:classify.fastai Classifier based on fastai 欢迎访问: 字符识别分类器 基于fastai进行构造 以往的fastai教程都是很简单的几行进行一个模型的训练,对初学者来说看起来很简单。但是仅仅训练一个分类的网络是远远不够的,我们还需要各种指标对分类的效果进行评 阅读全文
posted @ 2019-06-11 22:47 pprp 阅读(1955) 评论(0) 推荐(0)
摘要:1. 环境搭建 将github库download下来。 git clone https://github.com/ultralytics/yolov3.git 建议在linux环境下使用anaconda进行搭建 conda create -n yolov3 python=3.7 安装需要的软件 pi 阅读全文
posted @ 2019-05-14 17:35 pprp 阅读(46231) 评论(121) 推荐(8)
摘要:论文地址:http://arxiv.org/abs/1811.11168 作者:pprp 时间:2019年5月11日 0. 摘要 DCNv1引入了可变形卷积,能更好的适应目标的几何变换。但是v1可视化结果显示其感受野对应位置超出了目标范围,导致特征不受图像内容影响(理想情况是所有的对应位置分布在目标 阅读全文
posted @ 2019-05-11 10:15 pprp 阅读(3709) 评论(0) 推荐(0)