原理

一般情况下,要处理是一副具有固定分辨率的图像。但是特别情况下,需要对同一个图像的不同分别率的子图像进行处理。如查找图像中的某个目标,如人脸、不知道目标在图像中的尺寸大小。这种情况下,需要创建一组图像,这些图像是具有不同分辨率的原始图像。把这组图像叫做图像金字塔,就是同一图像的不同分辨率的子图集合。把最大的图像放在底部,最小的放在顶部,看起来就像一座金字塔。

有两类:高斯金字塔和拉普拉斯金字塔

高斯金字塔

高斯金字塔的顶部是通过将底部图像中的连续的行和列去除得到的。顶部图像中的每个像素值等于下一层图像中5个像素的高斯加权平均值。这样操作一次一个MxN的图像就变成了一个M/2xN/2的图像。所以这幅图像的面积就变为原来图像面积的四分之一。这被称为Octave。连续这样的操作,就会得到一个分辨率不断下降的图像金字塔。可以使用函数cv.pyrDown()和cv.pyrUp()构建图像金字塔。

cv.pyrDown从一个高分辨率大尺寸的图像向上构建一个金字塔(尺寸变小,分辨率降低)

import cv2 as cv

img=cv.imread('./images/lena.jpeg')
lower_reso=cv.pyrDown(img)
cv.imshow('img',img)
cv.imshow('lower_reso',lower_reso)
cv.waitKey(0)
cv.destroyAllWindows()

cv.pyrUp从一个低分辨率小尺寸的图像向上构建一个金字塔(尺寸变大,但分辨率不会增加)

import cv2 as cv

img=cv.imread('./images/lena.jpeg')
lower_reso=cv.pyrDown(img)
higher_reso=cv.pyrUp(img)
cv.imshow('img',img)
cv.imshow('lower_reso',lower_reso)
cv.imshow('higher_reso',higher_reso)
cv.waitKey(0)
cv.destroyAllWindows()

要记住的是higher_reso2和high_reso是不同的,因为一旦使用cv.pyrDown图像的分比率就会降低,信息就会被丢失。

拉普拉斯金字塔

拉普拉斯金字塔可以由高斯金字塔计算得来。公式如下:

 拉普拉斯金字塔的图像看起来就像是边界图,其中很多像素都是0,常被用在图像压缩中。拉普拉斯金字塔的层有高斯金字塔的层与高斯金字塔的高层的扩展版本之间的差形成。

使用金字塔进行图像融合

金字塔的一种应用是图像融合。如在图像拼接中需要将两个图像堆叠在一起,但是由于图像之间的不连续性,可能看起来不太好。在这种情况下,使用金字塔混合图像可以无缝混合,而不会在图像中保留大量数据。

具体步骤:

  1. 加载苹果和橙子的两个图像
  2. 查找苹果和橙子的高斯金字塔(在此示例中,级别数为6)
  3. 在高斯金字塔中,找到其拉普拉斯金字塔。
  4. 然后在每个拉普拉斯金字塔级别中加入苹果的左半部分和橙子的右半部分
  5. 最后从此联合图像金字塔中重建原始图像。
import cv2 as cv
import numpy as np,sys

A = cv.imread('apple.jpg')
B = cv.imread('orange.jpg')
# 生成A的高斯金字塔
G = A.copy()
gpA = [G]
for i in range(6):
    G = cv.pyrDown(G)
    gpA.append(G)
# 生成B的高斯金字塔
G = B.copy()
gpB = [G]
for i in range(6):
    G = cv.pyrDown(G)
    gpB.append(G)
# 生成A的拉普拉斯金字塔
lpA = [gpA[5]]
for i in range(5,0,-1):
    GE = cv.pyrUp(gpA[i])
    L = cv.subtract(gpA[i-1],GE)
    lpA.append(L)
# 生成B的拉普拉斯金字塔
lpB = [gpB[5]]
for i in range(5,0,-1):
    GE = cv.pyrUp(gpB[i])
    L = cv.subtract(gpB[i-1],GE)
    lpB.append(L)
# 现在在每个级别中添加左右两半图像
LS = []
for la,lb in zip(lpA,lpB):
rows,cols,dpt = la.shape
ls = np.hstack((la[:,0:cols/2], lb[:,cols/2:]))
LS.append(ls)
# 现在重建
ls_ = LS[0]
for i in xrange(1,6):
ls_ = cv.pyrUp(ls_)
ls_ = cv.add(ls_, LS[i])
# 图像与直接连接的每一半
real = np.hstack((A[:,:cols/2],B[:,cols/2:]))
cv.imwrite('Pyramid_blending2.jpg',ls_)
cv.imwrite('Direct_blending.jpg',real)

 

 posted on 2024-05-03 20:36  会飞的金鱼  阅读(32)  评论(0)    收藏  举报