随笔分类 -  Object Detection

摘要:Smooth L1 Loss 作用 当预测框与 ground truth 差别过大时,梯度值不至于过大; 当预测框与 ground truth 差别很小时,梯度值足够小。 数学公式 损失函数对X的导数分别为: 方程 (4),当x增大时 L2 损失对x的导数也增大。这就导致训练初期,预测值与 grou 阅读全文
posted @ 2020-09-12 15:03 瞬_冷 阅读(474) 评论(0) 推荐(0)
摘要:(目录) paper https://arxiv.org/pdf/1804.02767v1.pdf 网络结构图 性能上远超Darknet-19,但在效率上同样优于ResNet-101和ResNet-152。下表是在ImageNet上的实验结果: 网络详细结构图: 网络简版结构图: 数据处理 trai 阅读全文
posted @ 2020-08-19 23:11 瞬_冷 阅读(897) 评论(0) 推荐(0)
摘要:paper https://arxiv.org/pdf/1512.02325.pdf 网络结构图 简版: 详细版: 特点: Multi-scale feature maps for detection 多尺度特征图 卷积特征层尺寸逐步增加,可以在不同 scales 预测检测结果 Convolutio 阅读全文
posted @ 2020-08-17 17:03 瞬_冷 阅读(372) 评论(0) 推荐(0)
摘要:https://handong1587.github.io/categories.html#deep_learning-ref 阅读全文
posted @ 2020-07-31 10:01 瞬_冷 阅读(125) 评论(0) 推荐(0)
摘要:论文链接地址:https://pjreddie.com/media/files/papers/YOLOv3.pdf YOLO3主要的改进有:调整了网络结构;利用多尺度特征进行对象检测;对象分类用Logistic取代了softmax 网络结构: Feature Extractor(darknet-53 阅读全文
posted @ 2020-07-28 18:05 瞬_冷 阅读(130) 评论(0) 推荐(0)
摘要:这三种网络结构主要是用于物体的检测以及识别。 一、RCNN: 首先使用搜索算法(SelectiveSearch)在图像上面选取出来大约2k个候选框,然后将这些候选框都送入到网络中进行特征提取,然后在对其进行分类与回归。 RCNN存在三个明显的问题: 1)多个候选区域对应的图像需要预先提取,占用较大的 阅读全文
posted @ 2020-07-28 18:03 瞬_冷 阅读(1791) 评论(0) 推荐(0)
摘要:论文地址:https://arxiv.org/abs/1612.08242 网络结构: 大多数检测框架依赖于VGG-16作为的基本特征提取器。VGG-16是一个强大的,准确的分类网络,但它是不必要的复杂。在单张图像224×224分辨率的情况下VGG-16的卷积层运行一次前馈传播需要306.90亿次浮 阅读全文
posted @ 2020-07-28 17:53 瞬_冷 阅读(239) 评论(0) 推荐(0)
摘要:论文链接:https://arxiv.org/abs/1711.07767 RFBNet整体是在SSD的基础上面进行修改的 网络结构: 和SSD不同的是:1、主干网上用两个RFB结构替换原来新增的两层。2、conv4_3和conv7_fc在接预测层之前分别接RFB-s和RFB结构。 引入RFB的出发 阅读全文
posted @ 2020-07-28 17:50 瞬_冷 阅读(270) 评论(0) 推荐(0)
摘要:主要是在focal loss的基础上对location和classification都做了平衡处理。 GHC思想: 1. 首先先计算出X预测输出的梯度: 于是我们可以定义一个梯度模长,g=|p-p*| 2. 由于梯度均衡本质上是对不同样本产生的梯度进行一个加权,进而改变它们的贡献量,而这个权重加在损 阅读全文
posted @ 2020-07-28 17:00 瞬_冷 阅读(1357) 评论(0) 推荐(0)
摘要:论文地址:https://arxiv.org/pdf/1506.02640.pdf YOLO: 网络结构: Input image size:448 * 448 * 3 , output tensor:7 * 7 * 30 (boxes number * (x, y, w, h, confidenc 阅读全文
posted @ 2019-03-06 21:24 瞬_冷