摘要: 一、简介 ​SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》。在此之前,所有的神经网络都是需要输入固定尺寸的图片,比如224×224(Im 阅读全文
posted @ 2019-05-09 14:42 bupt213 阅读(15087) 评论(1) 推荐(0)
摘要: 一、 简介 本文介绍了不同的角度估计方法在同一情况中的比较,以及对影响性能的关键因素的详细分析。接下来,我们提出了一种新的联合训练方法和检测任务,并证明了它的好处。我们还强调了分类方法优于回归方法的优越性,量化了更深层架构和扩展训练数据的优势,并证明即使使用ImageNet训练数据,合成数据也是有益 阅读全文
posted @ 2019-05-06 10:37 bupt213 阅读(2556) 评论(1) 推荐(0)
摘要: 1. 卷积操作只关注于局部的感受野,是典型的local operation,如果要增大神经元的感受野,一般是堆叠卷积层和池化层来实现,但是这样计算量和复杂度都会增加,并且feature map的尺寸会较小。为了突破,作者借鉴图像去噪这个领域的non-local操作,提出了non-local neural network,用来捕捉长距离像素之间的信息,最终实现每个像素的全局感受野。并且通过不同的操作,还可以得到不同空间、时间、通道的像素之间的信息相关性。non-local这个模块在在视频分类的任务上,在Kinetics和Charades上都达到了最好的结果;在图像识别的任务上,non-local模型提高了COCO上物体检测/物体分割/姿态估计等任务的结果。   2. 本文提出了一种用于语义分割的纵横交错网络(CCNet),该网络自适应地捕获纵横交错路径上的长程上下文信息。为了获得密集的上下文信息,我们引入了递归交叉注意模块,它从所有像素聚集上下文信息。消融实验表明,周期性的纵横交错注意力能够以更低的计算成本和存储成本获取密集的长期上下文信息。我们的CCNet在两个语义分割数据集(即城市 阅读全文
posted @ 2019-04-24 15:40 bupt213 阅读(4857) 评论(2) 推荐(1)