随笔分类 - 图像处理&CV
Digital Image Processing and Computer Vision
摘要:"UijlingsIJCV2013, Selective Search For Object Recognition" "code" 算法思想 利用分割算法将图片细分成很多region, 或超像素. 在这个基础上, 将邻近的相似region融合起来. 聚合过程中得到的region作为proposal
阅读全文
摘要:Notes on "Efficient Graph Based Image Segmentation" 算法的目标 按照一种确定的标准, 将图片分割成细粒度的语义区域, 即Super pixel. 算法步骤 预处理. 将图片转换为undirected graph: $G(V, E)$: 每一个像素都
阅读全文
摘要:HSV 相比于面向机器的RGB, HSV或HSI更贴近于人对颜色的描述: H: Hue, 颜色本身 S: Saturation, 纯色被白色稀释的程度. V: Value, 或I, Intensity. 与颜色类型无关的光强度. HSV 与RGB可以相互转换 将black white 的虚线作为中心
阅读全文
摘要:CMY 发光物体和反光物体产生颜色的机制不同. 前者指光源光, 它的颜色由发光波长决定. 后者指不能发光但却能表现出颜色的物体, 例如色素. 色素的颜色由它不能吸收的光的波长决定. 比如红色色素, 除了红色光对应的波长(范围), 其余的光都被它吸收了. 打印机使用色素染色, 为让人眼感知到RGB三种
阅读全文
摘要:RGB是面向机器的一种颜色空间. 虽然它表示$256 \times 256 \times 256$种不同的颜色, 但在实际中, 大部分机器都只实现了256种颜色. 安全色(Safe RGB colors)是对系统/机器不敏感的色彩(每种系统/机器都会实现它们), 又被称作all systems sa
阅读全文
摘要:Perimeter 边界长度. 计算方式跟边界的表示方式有关 Area 包含的点的个数 Compactness 两种常用的计算方式 1. $\frac {perimeter^2}{area}$. 2. circularity ratio = $\frac {\text{area}}{\text{ar
阅读全文
摘要:用所有属于boundary的点来表示boundary, 有两个主要的缺点, 一是数据量大, 二是对噪声敏感. 用boundary的一些representation而非精确的boundary本身来表示boundary, 不仅可以在一定程度上解决这两个问题, 还可以更方便的将boundary信息用于其他
阅读全文
摘要:又一个精妙的算法. 输入: 组成一个region, 或者它的boundary的点集$P$ 输出: 这个region 顺时针(或相反)的有序排列的边界点. 算法详细: 见图. 详见 DIP 11.1. 要点: 1. 将图片预处理为0 1mask, 并在四周padding上0, 以处理与边界重合的bou
阅读全文
摘要:两类特征 外部特征(external characteristics), 如boundary 内部特征(internal characteristics), 如像素, color, texture. 当对region的shape感兴趣时, 使用外部特征. 否则内部特征
阅读全文
摘要:读完10.4 Region Based Segmentation这一小节, 新get到的且需要留意的知识点: Region Spltting and Merging, quadtrees Watershed 算法里的几个概念: regional minima points: 一个region里的最低
阅读全文
摘要:因为噪声的存在, 检测出来的edge points有很多都是不相邻的. 所以边缘检测算法通常都有最后的连接步骤: 将属于同一edge的不相邻点连接起来(TODO, 是用一条路径将它们连通, 把路径中的点也作为边缘点吗?) Local Processing 最naive的做法就是检查每个已检测出边缘点
阅读全文
摘要:Canny边缘检测算法有自己的理论和经验性的推导, 没仔细看/没看明白. 它的步骤如下: 1. 对原图的灰度图进行高斯滤波 2. 求一阶导数, 得到每个像素点的梯度强度和方向. 3. 非最大抑制. 对每个edge candidate像素点, 在它的edge方向上, 它的$3\times 3$邻域内,
阅读全文
摘要:intensity梯度值分布跟图片的大小有关, 比如将一张小图片放大后会变得很模糊, 原先清晰的edge, 即大的梯度值变得模糊. 但是原有的边缘通常还是肉眼可分辨的. 但用Sobel 算子可能就检测不出来的. 为了应付不同scale与blur程度图片的边缘检测, 检测算子需要能大能小, 大的用于检
阅读全文
摘要:之前已经说过, 一阶和二阶导数都可以用来检测边缘(计算梯度值(gradient)), 但二阶导数对噪声更敏感, 所以, 相比而言, 一阶算子在edge detection中用的更广泛, 如Sobel 算子. 检测水平与垂直方向梯度的算子 检测对角线方向梯度的算子 Prewitt算子与Sobel算子都
阅读全文
摘要:三种edge 1. Step (阶梯) 2. Ramp (坡) 3. Roof 因为噪声的存在, ramp edge是最常见的. 一阶和二阶算子在ramp edge处的表现 一阶和二阶算子对噪声的敏感性 从上自下, 高斯噪声的方差分别为0, 0.1, 1, 10. 所以在进行edge detecti
阅读全文
摘要:多元函数的二阶导数又称为Laplacian算子: $$ \triangledown f(x, y) = \frac {\partial^2 f}{\partial x^2} + \frac {\partial^2 f}{\partial y^2} $$ 对于图像上的离散$f(x, y)$: $$ \
阅读全文
摘要:一阶导数与二阶导数的计算 图像$I$可以看作$(x, y) \in N^2 \to N$的映射: $i = f(x, y)$. 其中$N$为正整数.很明显$f$在定义域上是不连续的. 不连续函数$f(x, y)$的导数, 严格来说不算能算作导数, 只是形式上与真正的导数相似. 取$\Delta x
阅读全文
摘要:Definition 图像分割将一张图分为$n$个region, 需要满足下面5个条件 1. 每一个像素都要属于一个region 1. 每个region都是连通的 1. region与region之间没有交集 1. region内像素点具有相同的目标性质 1. 不相邻的region的像素点目标性质不
阅读全文
摘要:什么是仿射变换? Affine Transformation.任意由线性变换(矩阵乘法)+向量加法操作构成的变换操作. 包括平移(Translation), Rescale(放缩), Rotate(旋转). 仿射变换的视觉特点是: 原图中平行的线在变换后图片中仍然平行. (而透视变换Perspect
阅读全文
摘要:What? 对原图进行不同scale的resize操作得到包括原图在内的一系列不同大小的图片, 可组成图像的金字塔模型. 从塔顶到塔底, 从粗糙到精细. For What? 应对目标物体大小不确定的情况 节省计算资源.
阅读全文

浙公网安备 33010602011771号