随笔分类 - 计算机视觉
摘要:分类的深度网络最新的两个注意点: 1、SENet(Squeeze-and-Excitation Networks)- 论文的动机是从特征通道之间的关系入手,希望显式地建模特征通道之间的相互依赖关系。另外,没有引入一个新的空间维度来进行特征通道间的融合,而是采用了一种全新的“特征重标定”策略。具体来说
阅读全文
摘要:转自https://zhuanlan.zhihu.com/p/42018282 一 NMS NMS算法的大致思想:对于有重叠的候选框:若大于规定阈值(某一提前设定的置信度)则删除,低于阈值的保留。对于无重叠的候选框:都保留。 所谓非极大值抑制:先假设有6个输出的矩形框(即proposal_clip_
阅读全文
摘要:CornerNethourglass network -> prediction module = corner pooling -> heatmaps + embedding + offsets corner polling,获取角点信息1、左上角的点和左边和上边的特征有关,因此角池化后会有这两个
阅读全文
摘要:序言: 对于小目标图像分割任务,一副图画中往往只有一两个目标,这样会加大网络训练难度,一般有三种方法解决: 1、选择合适的loss,对网络进行合理优化,关注较小的目标。 2、改变网络结构,使用attention机制。 3、类属attention机制,即先检测目标区域,裁剪后再分割训练。 场景: 现在
阅读全文
摘要:1. 安装了keras_segmentation的包,使私人写的预先训练的网络。
阅读全文
摘要:时间顺序: FCN 、SegNet 、U-Net、Dilated Convolutions 、DeepLab (v1 & v2) 、RefineNet 、PSPNet 、Large Kernel Matters 、DeepLab v3 。 1、Fully Convolution Networks (
阅读全文
摘要:一、faster rcnn的结构 通过上面的结构,我们知道该faster rcnn前面以VGG16为框架,加入RPN层,最后做分类层。 采用VGG16相对ZF来说慢一点,但是精度也高一点。 二、RPN结构 RPN层的引入,极大提升检测框的生成速度。RPN是指以下结构: 前面的卷积结果过来后,分两路来
阅读全文
摘要:四个层的forward函数分析: RoIDataLayer:读数据,随机打乱等 AnchorTargetLayer:输出所有anchors(这里分析这个) ProposalLayer:用产生的anchors平移整图,裁剪出界、移除低于阈值的的anchors,排序后使用nms,返回顶部排名的ancho
阅读全文
摘要:接着上篇的博客,我们获取imdb和roidb的数据后,就可以搭建网络进行训练了。 我们回到trian_rpn()函数里面,此时运行完了roidb, imdb = get_roidb(imdb_name),取得了imdb和roidb数据。 先进入第一阶段的训练: 进入子进程train_rpn: 接着我
阅读全文
摘要:这周看完faster-rcnn后,应该对其源码进行一个解析,以便后面的使用。 那首先直接先主函数出发py-faster-rcnn/tools/train_faster_rcnn_alt_opt.py 我们在后端的运行命令为 python ./py-faster-rcnn/tools/train_fa
阅读全文
摘要:一、 Faster-RCNN代码解释 先看看代码结构: Data: This directory holds (after you download them): Caffe models pre-trained on ImageNet Faster R-CNN models Symlinks to
阅读全文