判断两张图片是否类似
如何判断两张图是否相似?
查到了很多算法,流程都是“特征提取”,“特征对比”。以下列出了三个常见算法
### 平均哈希算法
平均哈希算法是三种Hash算法中最简单的一种,它通过下面几个步骤来获得图片的Hash值,这几个步骤分别是(1) 缩放图片;(2)转灰度图; (3) 算像素均值;(4)根据相似均值计算指纹。具体算法如下所示:

得到图片的ahash值后,比较两张图片ahash值的汉明距离,通常认为汉明距离小于10的一组图片为相似图片。
#### 例子:

##### 其中转为8x8尺寸的Lena对应的数据矩阵为:

##### 很容得到如上矩阵所有元素的均值a= 121.328125, 将上述矩阵中大于或等于a的元素置为1, 小于a的元素置为0,可得:

所以可得Lena图的aHash为
1011111010011110100111011010100110101011101000110000111000101100
将二进制形式ahash转十六进制hash为
be9e9da9aba30e2c
将两张图片进行平均hash后,再计算出各自的汉明距离
##### 图Lena(noise):

##### 图Barbara:

##### 图汉明距离:

### 感知哈希算法
感知哈希算法是三种Hash算法中较为复杂的一种,它是基于DCT(离散余弦变换)来得到图片的hash值(补充:关于DCT具体如何转换参考 https://www.jianshu.com/p/b923cd47ac4a ),其算法几个步骤分别是(1) 缩放图片;(2)转灰度图; (3) 计算DCT;(4)缩小DCT; (5)算平均值;(6) 计算指纹。具体算法如下所示:

### 差异哈希算法
相比pHash,dHash的速度要快的多,相比aHash,dHash在效率几乎相同的情况下的效果要更好,它是基于渐变实现的。其算法几个步骤分别是(1) 缩放图片(2)转灰度图; (3)算差异值;
(4)算平均值; (5)计算指纹。具体算法如下所示:

具体平均hash的测试代码详见:
https://github.com/yuanting2016/similarpicture

浙公网安备 33010602011771号