语义分割中的nonlocal[8]- ACFNet: Attentional Class Feature Network for Semantic Segmentation

https://arxiv.org/abs/1909.09408
文章也是通过引入class-level的context来提升效果
先看整体结构

其中Pcoarse是预测的score map,ccb这样得到的每个class center是与全局所有的pixel相关的,这样每个pixel对于其对应的class 就有了对应的关系,利于feature consistency。
这里的normalize就不是softmax了。
与本文不同的是OCR中计算的是Pixel到Region的relation map,这里的attention只是用了class center。
来看下结果,也是由不错的提升,其中表1中的+class center是指直接将其append到每个pixel之后得到的结果。

posted on 2021-02-27 11:08  treeaxx  阅读(159)  评论(0)    收藏  举报