06 2019 档案
摘要:多尺度检测(不同的idea) (特征金字塔)(空间金字塔池化)(带洞空间金字塔池化)(融合深浅层特征) 检测和分割中的例子 分割: sppnet中的spp空间金字塔池化结构;(spatial pyramid pooling) pspnet中的pyramid pooling moudle结构,综合讲是
阅读全文
摘要:成功的因素: 1.级联而非并联检测器 2.提升iou阈值训练级联检测器的同时不带来负面影响 核心思想: 区分正负样本的阈值u取值影响较大,加大iou阈值直观感受是可以增加准确率的,但是实际上不是,因为这时候正负样本不均衡,所以要做出改变; 所以得出的cascade R-CNN由一系列的检测模型组成,
阅读全文
摘要:1.降维或升维,减少参数量 通过1*1卷积核的个数,来控制输出的通道数也就是维度 通过一次卷积操作,W*H*6将变为W*H*1,这样的话,使用5个1*1的卷积核,显然可以卷积出5个W*H*1,再做通道的串接操作,就实现了W*H*5 对于某个卷积层,无论输入图像有多少个通道,输出图像通道数总是等于卷积
阅读全文
摘要:RFCN的核心是通过修改roi pooling的位置,来增加共享参数的层,减少运算时间; roi pooling位置的影响如下: 越靠近 Input - 对应 ROI-Wise 检测子网越深,准确度也就越高; 越靠近 Output - 对应 ROI-Wise 子网越浅,针对每个 ROI 计算量就越小
阅读全文
摘要:iou 使用loU看检测是否正确需要设定一个阈值,最常用的阈值是0.5,即如果loU>0.5,则认为是真实的检测 P代表每张图像中被检测出的正确目标占总目标数的多少; AP代表对于一个类别,假如100张图像,计算平均精度;分子是图像的个数,分母是总精度的和; MAP=所有类别的平均精度求和除以所有类
阅读全文
摘要:对于视频来讲,相邻帧目标之间存在 明显的上下文关系,这种关系在技术上的表现就是 Tracking FLOW 流,一般是指视频两帧之间的流信息; MGP motion guide propagation 运动指导传播, 主要为了减少漏检; MCS multi context suppression 多
阅读全文
摘要:模型的结构大致由图可以完整展现,三个分类是否人脸的12、24、48net,再加上三个用于修正预测框的分类网络; 这三个分类是否人脸的网络,结构逐渐变复杂, 由上图可以看出,前2阶的网络都非常简单,只有第3阶才比较复杂。这不是重点,重点是我们要从上图中学习多尺度特征组合。 以第2阶段的24-net为例
阅读全文
摘要:OpenCV 中的 Haar feature-based cascade classifiers 来检测图像中的人脸。OpenCV 提供了很多预训练的人 脸检测模型,它们以XML文件保存在 github
阅读全文
摘要:傅里叶变换 傅里叶变换在实际中有非常明显的物理意义,设f是一个能量有限的模拟信号,则其傅里叶变换就表示f的频谱。 图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。如:大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率值很低;而对于地表属性变换剧烈的边缘区域在图像中是一片
阅读全文
摘要:高斯金字塔 高斯金字塔的顶部是通过将底部图像中的连续的行和列去除得到的。顶部图像中的每个像素值等于下一层图像中 5 个像素的高斯加权平均值。 这样操作一次一个 MxN 的图像就变成了一个 M/2xN/2 的图像。所以这幅图像的面积就变为原来图像面积的四分之一。 可以得到一个分辨率不断下降的图像金字塔
阅读全文
摘要:形态学转换 腐蚀 膨胀 先进性腐蚀再进行膨胀就叫做开运算。就像我们上面介绍的那样,它被用来去除噪声。这里我们用到的函数是 cv2.morphologyEx()。 图像梯度 梯度简单来说就是求导,对于像素点的分布曲线求导,然后在像素变化较大的地方即为边缘,通过求导可以求出边缘的位置。 OpenCV 提
阅读全文
摘要:2D卷积操作 cv.filter2D() 可以让我们对一幅图像进行卷积操作, 图像模糊(图像平滑)使用低通滤波器可以达到图像模糊的目的。这对与去除噪音很有帮助。其实就是去除图像中的高频成分(比如:噪音,边界)。所以边界也会被模糊一点。(当然,也有一些模糊技术不会模糊掉边界)。OpenCV 提供了四种
阅读全文
摘要:几何变换 缩放 旋转 仿射变换 仿射变换有旋转 (线性变换),平移 (向量加).缩放(线性变换),错切,反转; 仿射变换是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”(直线经过变换之后依然是直线)和“平行性”(二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的
阅读全文
摘要:颜色空间转换 对图像进行颜色空间转换,比如从 BGR 到灰度图,或者从BGR 到 HSV 等 我们要用到的函数是:cv2.cvtColor(input_image ,flag),其中 flag就是转换类型,常用的就几种转换的类型; 对于 BGR↔Gray 的转换,我们要使用的 flag 就是 cv2
阅读全文
摘要:可以根据像素的行和列的坐标获取他的像素值。对 BGR 图像而言,返回值为 B,G,R 例如获取蓝色的像素值: img=cv2.imread('messi5.jpg')px=img[100,100]blue=img[100,100,0] 获取图像属性 图像的属性包括:行,列,通道,图像数据类型,像素数
阅读全文
摘要:图像的基本操作 cv.imread() 读取图片 cv.imshow() 显示图片 cv2.imwrite() 保存图像 使用摄像头捕获实时图像 OpenCV 为这中应用提供了一个非常简单的接口 从文件中播放视频 只需要改变ViddeoCapture的参数为文件名字即可
阅读全文
摘要:目标检测主流方法有两大类 two-stage,以rcnn系列为主,采用建议框的方式对目标进行预测,过程首先要经过网络生成候选框,分类背景前景与进行第一次回归,之后再进行一次精细回归。 优点是准确率高,但速度较one-stage慢 one-stage,以yolo 、sdd等为主,通过事先制定先验框(对
阅读全文

浙公网安备 33010602011771号