随笔分类 - 计算机视觉与深度学习
摘要:首先明确几个概念,精确率,召回率,准确率 精确率precision 召回率recall 准确率accuracy 以一个实际例子入手,假设我们有100个肿瘤病人. 95个良性肿瘤病人,5个恶性肿瘤病人. 我们有一个检测系统,去检测一个肿瘤病人是否为恶性. 那么,对我们的系统来说,有100个样本,5个正
阅读全文
摘要:"torch实现yolov3(1)" "torch实现yolov3(2)" "torch实现yolov3(3)" "torch实现yolov3(4)" 前面4篇已经实现了network的forward,并且将network的output已经转换成了易于操作的detection prediction格
阅读全文
摘要:我自己的一个体会,在学习机器学习和深度学习的过程里,包括阅读模型源码的过程里,一个比较大的阻碍是对numpy掌握的不熟,有的时候对矩阵的维度,矩阵中每个元素值的含义晕乎乎的. 本文就以一个2 x 2 x 3的三维矩阵为例,说明矩阵是如何表示图像的. 3d array表示一个图片.比如对ex = nu
阅读全文
摘要:20191008 服务器上的cuda总是被人搞坏掉,好烦.记录下: 卸载干净cuda sudo rm rf /usr/local/cuda sudo apt get remove cuda sudo apt get autoclean sudo apt get remove cuda 重新安装 su
阅读全文
摘要:在 "上一篇" 里我们实现了forward函数.得到了prediction.此时预测出了特别多的box以及各种class probability,现在我们要从中过滤出我们最终的预测box. 理解了yolov3的输出的格式及每一个位置的含义,并不难理解源码.我在阅读源码的过程中主要的困难在于对pyto
阅读全文
摘要:之前的文章里https://www.cnblogs.com/sdu20112013/p/11099244.html实现了网络的各个layer. 本篇来实现网络的forward的过程. 定义网络 实现网络的forward过程 forward函数继承自nn.Module Convolutional an
阅读全文
摘要:配置文件 配置文件yolov3.cfg定义了网络的结构 配置文件描述了model的结构. yolov3 layer yolov3有以下几种结构 Convolutional Shortcut Upsample Route YOLO Convolutional Shortcut 类似于resnet,用以
阅读全文
摘要:理解一个算法最好的就是实现它,对深度学习也一样,准备跟着https://blog.paperspace.com/how to implement a yolo object detector in pytorch/一点点地实现yolov3.达到熟悉yolov3和pytorch的目的. 这篇作为第一篇
阅读全文
摘要:转自https://blog.csdn.net/watermelon1123/article/details/82083522 前些日子因工程需求,需要将yolov3从基于darknet转化为基于Caffe框架,过程中踩了一些坑,特在此记录一下。 1.Yolov3的网络结构 想要转化为Caffe框架
阅读全文
摘要:小目标检测很难,为什么难.想象一下,两幅图片,尺寸一样,都是拍的红绿灯,但是一副图是离得很近的拍的,一幅图是离得很远的拍的,红绿灯在图片里只占了很小的一个角落,即便是对人眼而言,后者图片中的红绿灯也更难识别. 说回到cnn,不断地卷积以后,feature map的尺寸变小.这时候feature ma
阅读全文
摘要:目标检测,即在一幅图里框出某个目标位置.有2个任务. 定位出目标的边界框 识别出边界框内的物体的类别 Sliding window detectors 一种暴力的目标检测方法就是使用滑动窗口,从左到右,从上到下扫描图片,然后用分类器识别窗口中的目标.为了检测出不同的目标,或者同一目标但大小不同,必须
阅读全文
摘要:本文记录一些对深度学习的思考总结.意识流写法,想到哪写到哪,日后不定期更新补充. 在没有接触深度学习的时候,觉得这是个非常高大上的技术,数学基础要求非常多,上手门槛非常高.我想很多人和我有一样的想法.这种对深度学习的印象,我想很大一部分来自铺天盖地的自媒体的有关AI的报道解读,造成了一种深度学习,人
阅读全文
摘要:yolov3 kmeans yolov3在做boundingbox预测的时候,用到了anchor boxes.这个anchors的含义即最有可能的object的width,height.事先通过聚类得到.比如某一个feature map cell,我想对这个feature map cell预测出一个
阅读全文
摘要:理论 http://www.cnblogs.com/wangguchangqing/p/4045150.html 翻开任意一本图像处理的书,都会讲到图像的几何变换,这里面包括:仿射变换(affine transformation)、投影变换(projecttive transformation)。前
阅读全文
摘要:转自https://blog.csdn.net/xuelabizp/article/details/50314633 1.针 孔 摄 像 机 模型 在介绍摄像机标定参数之前,需要先简单说一下针孔 摄 像 机的原理。投影平面到小孔的距离为焦距f,物体到小孔的距离为Z,其中物体和投影是倒立相似的关系,下
阅读全文
摘要:目的 缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的: 1、使得图像符合显示区域的大小; 2、生成对应图像的缩略图。 放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的是放大原图像,从而可以显示在更高分辨率
阅读全文
摘要:最近在做与目标检测模型相关的工作,很多都要求VOC格式的数据集. PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, PASCAL全称:Pattern Analysis, Statical Modeling and Co
阅读全文
摘要:最近工作里需要用到tensorflow的pretrained model去做retrain. 记录一下. 为什么可以用pretrained model去做retrain 这个就要引出CNN的本质了.CNN的本质就是求出合适的卷积核,提取出合理的底层特征.进而为不同的特征赋以权重.从而表达图像. 通俗
阅读全文
摘要:像素:组成图片的基础单元 现在的多数表征图像的方式都是采用的RGB color space.图片可视为由width\ height个像素组成.在RGB颜色空间下每一个像素是一个三元组(r,g,b),分别代表R/G/B的值.对单通道的图像(即灰度图)来说,像素是一个数. 图片由一堆像素组成.[0 25
阅读全文
摘要:如何安装 tensorrt安装后的so如下图所示.所以一台机器只能有一个版本的tensorrt. TensorRT是什么 建议先看看这篇https://zhuanlan.zhihu.com/p/35657027 深度学习 训练 部署 平常自学深度学习的时候关注的更多是训练的部分,即得到一个模型.而实
阅读全文
浙公网安备 33010602011771号