随笔分类 - CV
图像处理相关论文笔记
摘要:YOLOv4 作者:AlexeyAB paper:YOLOv4: Optimal Speed and Accuracy of Object Detection code:code 比较优秀的解析论文:YOLOv4 目标检测 亮点 input:使用Mosaic数据增强,cmBN跨小批量标准化、SAT自
阅读全文
摘要:YOLOv3 作者:Joseph Redmon CVPR'18 paper:YOLOv3: An Incremental Improvement 亮点 提出新的backbone-darknet53 没有池化层和全连接层 增加了分支,用于检测小目标对象(13$\times$13, 26$\times$
阅读全文
摘要:YOLOv1 作者:Joseph Redmon CVPR'16 paper:YOLOv1 亮点 将目标检测当作是一个回归任务,使用一个网络预测类别和bounding box 网络结构 传统的目标检测方法先生成候选框,然后在候选框的基础上进行分类,修正边框,去重复框等操作,速度慢。 本文将目标检测视为
阅读全文
摘要:Faster R-CNN 作者:Ross B. Girshick NIPS'15 paper:Faster R-CNN 亮点 提出RPN解决select search速度慢的问题 网络结构 流程 输入图像会被缩放到$M\times N$大小 采用一系列卷积操作,得到对应的特征图 特征图输入RPN网络
阅读全文
摘要:Fast R CNN 和R CNN是同一位作者 paper: "Fast R CNN" 亮点 引用ROI pooling,可以输入任意尺寸的图像 region proposal在特征提取之后,可以共享卷积层部分的参数 分类部分换成全连接层softmax loss是分类+框回归的联合,不用分别训练 网
阅读全文
摘要:R-CNN 目标检测+深度学习开山之作 CVPR'14 paper:Rich feature hierarchies for accurate object detection and semantic segmentation 亮点 使用selection search(region propos
阅读全文
摘要:SPP-Net ECCV'14 Paper:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》 Abstract 现存的深度卷积神经网络要求固定输入图像的尺度(比如224*224),这种人工设
阅读全文
摘要:CSPNet paper:CSPNET: A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN Abstract 作者将模型推理过程需要庞大的计算量归因于网络优化过程中重复的梯度计算。 CSPNet整合了网络从开始到结束阶段的所有特征图
阅读全文
摘要:ResNet paper:Deep Residual Learning for Image Recognition Highlight 引入残差映射,使网络的深度有了极大的提升。 Abstract 针对神经网络增加深度后会难以训练的问题,作者提出了残差学习框架。残差结构引入了输入,在ImageNet
阅读全文
摘要:VGG paper: 《Very Deep Convolutional Networks for Large-Scale Image Recognition》 亮点 只使用3*3的卷积核,使用小卷积核但是更深的网络效果更好。 探索了不同深度的网络。 AlexNet里面的LRN没啥用。 网络结构 3*
阅读全文
摘要:AlexNet paper: 《ImageNet Classification with Deep Convolutional Neural Networks》 亮点 使用``ReLU`激活函数 使用LRN局部响应归一化 使用重叠的池化操作 使用Dropout减少过拟合 在ImageNet LSVR
阅读全文

浙公网安备 33010602011771号