王老头

导航

deeplab系列总结

原文链接:deeplab系列总结

简单总结下:

Deeplab v1&v2

ASPP结构:图右的结构,作者对比了单独的rate(左边结构),有不小的提升。多尺度进行dilation conv,其实RFBnet(2017 CVPR )对SSD的改进就是参考这个思路,inception + aspp。

v2用Resnet 101作为backbone,有一定提升,v1和v2都用了CRF。

CRF尝试找到图像像素之间的关系: 相近且相似的像素大概率为同一标签;CRF考虑像素的概率分配标签;迭代细化结果。

Deeplab v3

v3的创新点一是改进了ASPP模块;二是参考了图森组的Understanding Convolution for Semantic Segmentation中HDC的思想。其实就是对应纵横两种结构。backbone还是resnet 101.

Deeplab v3+

在deeplab v3中说到了需要8×/16×的upsample 最终的feature map,很明显这是一个很粗糙的做法。

v3+的创新点一是设计基于v3的decode module,二是用modify xception作为backbone。

论文中同样给出了一幅对比图,(a)是v3的纵式结构,(b)是常见的编码—解码结构,(c)是本文提出的基于deeplab v3的encode-decode结构。

论文中介绍了两种backbone,一是Resnet101,二是改进后的xception。xception效果好于resnet,所以我只关注了xception,毕竟v3+主打也是xception backbone。

 

posted on 2018-09-20 22:57  王老头  阅读(552)  评论(0)    收藏  举报