deeplab系列总结

简单总结下：

Deeplab v1&v2

ASPP结构：图右的结构，作者对比了单独的rate（左边结构），有不小的提升。多尺度进行dilation conv，其实RFBnet（2017 CVPR ）对SSD的改进就是参考这个思路，inception + aspp。

v2用Resnet 101作为backbone，有一定提升，v1和v2都用了CRF。

CRF尝试找到图像像素之间的关系：相近且相似的像素大概率为同一标签；CRF考虑像素的概率分配标签；迭代细化结果。

v3的创新点一是改进了ASPP模块；二是参考了图森组的Understanding Convolution for Semantic Segmentation中HDC的思想。其实就是对应纵横两种结构。backbone还是resnet 101.

在deeplab v3中说到了需要8×/16×的upsample 最终的feature map，很明显这是一个很粗糙的做法。

v3+的创新点一是设计基于v3的decode module，二是用modify xception作为backbone。

论文中同样给出了一幅对比图，（a）是v3的纵式结构，（b）是常见的编码—解码结构，（c）是本文提出的基于deeplab v3的encode-decode结构。

论文中介绍了两种backbone，一是Resnet101，二是改进后的xception。xception效果好于resnet，所以我只关注了xception，毕竟v3+主打也是xception backbone。

posted on 2018-09-20 22:57 王老头阅读(552) 评论(0) 收藏举报

刷新页面返回顶部