Saliency Detection: A Boolean Map Approach学习笔记

1. 本论文最最吸引人的地方or让人匪夷所思的地方:

方法看起来很简单,但是方法效果很好,在5个眼动数据集上具有一致的state-of-the-art性能,在salient object detection方面,其效果宣称优于Hierarchical Saliency Detection。基本步骤如下:

  1.       1: B={}    //布尔图像集合
  2.       2: 在Lab颜色空间,对于图像的每一个通道\{\phi_k(I):k=1,2,3\},normalize到[0,255]
  3.       3:     for \theta ~=~ 0 ~:~ \sigma ~:~ 255
  4.       4:           B=THRESH(\phi_k(I),\theta);
  5.       5:           \tilde{B}=INVERT(B);
  6.       6:          将OPENING(B, \omega_0) 与OPENING(\tilde{B}, \omega_0) 加入到B中。
  7.       7:对于每一个B_k \in B
  8.       8:     A_k=\mathbf{\mbox{ZEROS}}(B_k,\mbox{~size()})
  9.       9:     若B_k(i,j)属于surrounded region,则将A_k(i,j)置为1;
  10.       10:     A_k=DILATION(A_k,\omega_{d1})
  11.       11:     A_k=NORMALIZE(A)
  12.       12: \bar{A}=\frac{1}{n}\sum_{k=1}^n A_k
  13.       13: S=POST_PROCESS(\bar{A})
  14.       14: 返回S

2. 摘要

(1) 本文提出了一个基于布尔图的显著性检测模型(Boolean Map based Saliency Detection, BMS);

(2) 图像由一些列的二值图像表示,这些二值图像是通过对图像的颜色通道进行随机阈值化生成;

(3) 本文是基于图形-背景分割的格式塔准则,通过分析布尔图的拓扑结构计算显著图;

(4) 简单有效

(5) 在5个眼动数据集上具有一致的state-of-the-art性能,在显著对象检测上也很有优势(是不是这句话感动了审稿人呢?)

3. 动机

      作者说已有的方法将局部图像块的对比度、rarity等用于显著对象的检测中,这样做的一个缺点是限制了对全局感知现象的建模的能力,而这种全局感知现象与视觉注意的实施相关。其中一个全局感知是图形-背景分割。格式塔心理学研究表明,相比于背景,图形比背景更容易到达,而且图形-背景的标定在没有集中注意的情况下也会发生。神经科学上的发现表明,在人和猴子的大脑中,参与形状感知的某些响应严重依赖图形-背景标定,这表明这一过程可能发生在早期视觉。

      所以本文的工作提出了一个新的基于布尔图的显著性模型,这个模型利用了全局拓扑测度,这一拓扑测度已经被证明了有助于感知的图形-背景分割。如格式塔心理学研究表明,如下因素很可能会影响图形-背景分割:大小,surroundedness,convexity, symmtry。本文研究surroundedness cue在显著性检测中的应用。surroundedness的本质是图形和背景之间的enclosure topological relationship,能够被很好地定义,并且对不同的变化具有不变性(不懂)。为了衡量surroundedness,BMS用二值图像集合表示图像。在BMS中,一个注意图(attention map)通过二值图处理技术激活给定的布尔图中的具有closed outer contours的区域来计算获得。显著性则根据期望注意图获得,也就是平均注意图。这个平均主义通过后续的处理可以用注视点的预测或是显著对象的检测。

4. 作者给出了代码,MATLAB R2012b+OPENCV 2.4.8可以运行通过

5. 至今不明白效果怎么就这么牛掰掰。

posted @ 2014-03-11 20:43  qingliu411  阅读(2457)  评论(0编辑  收藏  举报