论文阅读笔记《Gated Context Aggregation Network for Image Dehazing and Deraining》WACV19

 

目录:

  • 相关链接
  • 方法亮点
  • 方法细节
  • 实验结果
  • 总结与收获

相关链接:

论文:https://arxiv.org/abs/1811.08747

源码:暂无


 

方法亮点:

  • 提出端到端的去雾网络,不依赖于先验
  • 采用了smooth dilated convolution 代替原有的dilated convolution,解决了原来的dilated convolution导致的grid artifacts 问题
  • 提出了一个gated fusion sub-network,融合high-level 及low-level 特征,提升复原效果

 

方法细节:

1、smoothed dilated convolution

上面的图表示的是原始的空洞卷积的工作,从图中不同颜色的块块可以看出,经过dilated rate(r)>1的空洞卷积后,输出的特征层中相邻的特征值与输入特征层是完全独立的,没有相互依赖的关系,我们可以知道,图像是具有局部相关性的,同理,特征层也应该保留这个特性。

下面的图是经过改进的空洞卷积,在执行dilated rate>1的空洞卷积之前,做了一次核为(2r-1)的分离卷积,卷积的参数共享,经过该层卷积之后,每一个特征点都融合了周围(2r-1)大小的特征。该操作仅仅增加了(2r-1)(2r-1)大小的参数,却能有效的解决grid artifacts问题。

2、Gated fusion sub-network

 

 该子网络主要是融合了不同层次的特征信息,以往的网络都是直接添加short-cut操作进行信息融合,本文的Gate fusion network 为不同层次的特征分别学习了权重,最后加权得到融合的特征层。

3、network

 

 这篇文章的网络很简单,可以看做简单的三个部分:encoder,feature transfer,decoder.其中feature transfer部分是由若干个残差块组成的,残差块的卷积用到的是上面提到的smooth dilated convolution.encoder 第三部分中使用到一次下采样,相应的decoder中第一部分用到上采样。

这篇文章用到的损失函数相当的简单,就是一个简单的MSE,感觉作者还会就这个议题,再发一篇文章,可以关注一下。


 实验结果:

 

为了验证文章提出的两个结构的有效性,及将BN层改成IN层对该课题是有改进的,文章给出了在SOT indoor数据集上的ablation study .

smoothed dilation 模块的改进,提升了1PSNR,gated fusion 网络提升了约0.5PSNR,将BN改成IN也能提升将近1PSNR,从实验结果来看,文章提出的每个小改进都是很有效的,令人意外的是文章的baseline,竟然有这么好的效果

这篇文章的结果可以说是相当美丽了,PSNR及SSIM直接是质的飞跃。是一篇值得复现的文章。

视觉效果也还不错,但是GFN方法的视觉效果其实也是不错的,猜测是本文的方法恢复的结果,颜色信息更接近GT,所以PSNR更高。

 

 为了验证本文提出的方法具有通用性,文章给出了在去雨数据集上的实验结果。这个PSNR结果也是相当美丽,就是有点好奇为什么不给出SSIM的结果呢?

 

 


总结与收获:

 文章中采用的smoothed dilated convolution 及 gated fusion 网络在大部分图像复原中应该都能起到不错的作用。从SE-block之后,可以看出现在大部分工作对特征层的融合方式也有了新的考量,而不是简单的concat,包括本文的gated fusion也是基于这样的思想。

 

posted @ 2018-12-03 22:06  鸵鸟要抬头  Views(6199)  Comments(3Edit  收藏  举报