摘要:
1. 卷积操作只关注于局部的感受野,是典型的local operation,如果要增大神经元的感受野,一般是堆叠卷积层和池化层来实现,但是这样计算量和复杂度都会增加,并且feature map的尺寸会较小。为了突破,作者借鉴图像去噪这个领域的non-local操作,提出了non-local neural network,用来捕捉长距离像素之间的信息,最终实现每个像素的全局感受野。并且通过不同的操作,还可以得到不同空间、时间、通道的像素之间的信息相关性。non-local这个模块在在视频分类的任务上,在Kinetics和Charades上都达到了最好的结果;在图像识别的任务上,non-local模型提高了COCO上物体检测/物体分割/姿态估计等任务的结果。
2. 本文提出了一种用于语义分割的纵横交错网络(CCNet),该网络自适应地捕获纵横交错路径上的长程上下文信息。为了获得密集的上下文信息,我们引入了递归交叉注意模块,它从所有像素聚集上下文信息。消融实验表明,周期性的纵横交错注意力能够以更低的计算成本和存储成本获取密集的长期上下文信息。我们的CCNet在两个语义分割数据集(即城市 阅读全文
posted @ 2019-04-24 15:40
bupt213
阅读(4857)
评论(2)
推荐(1)