美文网首页
opencv+python -- 图像金字塔

opencv+python -- 图像金字塔

作者: 小兵12138 | 来源:发表于2019-04-14 16:34 被阅读0次

    图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构。图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。

    两种类型的金字塔:

    ①高斯金字塔:用于下采样。高斯金字塔是最基本的图像塔。原理:首先将原图像作为最底层图像G0(高斯金字塔的第0层),利用高斯核(5*5)对其进行卷积,然后对卷积后的图像进行下采样(去除偶数行和列)得到上一层图像G1,将此图像作为输入,重复卷积和下采样操作得到更上一层图像,反复迭代多次,形成一个金字塔形的图像数据结构,即高斯金字塔。

    ②拉普拉斯金字塔:用于重建图像,也就是预测残差,对图像进行最大程度的还原。比如一幅小图像重建为一幅大图,原理:用高斯金字塔的每一层图像减去其上一层图像上采样并高斯卷积之后的预测图像,得到一系列的差值图像即为 LP 分解图像。

    两种类型的采样:

    ①上采样:就是图片放大(所谓上嘛,就是变大),使用PryUp函数。 上采样步骤:先将图像在每个方向放大为原来的两倍,新增的行和列用0填充,再使用先前同样的内核与放大后的图像卷积,获得新增像素的近似值。

    ②下采样:就是图片缩小(所谓下嘛,就是变小),使用PryDown函数。下采样将步骤:先对图像进行高斯内核卷积 ,再将所有偶数行和列去除。

    总之,上、下采样都存在一个严重的问题,那就是图像变模糊了,因为缩放的过程中发生了信息丢失的问题。要解决这个问题,就得用拉普拉斯金字塔。

    Code

    import cv2 as cv
    
    
    def pyramid_demo(image):
        level = 3
        temp = image.copy()
        pyramid_images = []
        pyramid_images.append(image)
        for i in range(level):
            dst = cv.pyrDown(temp)
            pyramid_images.append(dst)
            cv.imshow("pyramid_down_"+str(i), dst)
            temp = dst.copy()
        return pyramid_images
    
    
    def laplace_demo(image):
        pyramid_images = pyramid_demo(image)
        level = len(pyramid_images)
        for i in range(level-1, 0, -1):
            expand = cv.pyrUp(pyramid_images[i], dstsize=pyramid_images[i-1].shape[:2])
            lpls = cv.subtract(pyramid_images[i-1], expand)
            cv.imshow("laplace_demo"+str(i), lpls)
    
    
    src = cv.imread("./data/lena.jpg", cv.IMREAD_COLOR)
    cv.namedWindow("lena", cv.WINDOW_AUTOSIZE)
    cv.imshow("lena", src)
    # pyramid_demo(src)
    laplace_demo(src)
    cv.waitKey(0)
    cv.destroyAllWindows()
    

    效果

    金字塔.png 拉普拉斯.png

    API

    1.pyrDown函数先对图像进行高斯平滑,然后再进行降采样(将图像尺寸行和列方向缩减一半)。
    其函数原型为:pyrDown(src[, dst[, dstsize[, borderType]]]) -> dst

    src参数表示输入图像。

    dst参数表示输出图像,它与src类型、大小相同。

    dstsize参数表示降采样之后的目标图像的大小。它是有默认值的,如果我们调用函数的时候不指定第三个参数,那么这个值是按照 Size((src.cols+1)/2, (src.rows+1)/2) 计算的。而且不管你自己如何指定这个参数,一定必须保证满足以下关系式:|dstsize.width * 2 - src.cols| ≤ 2; |dstsize.height * 2 - src.rows| ≤ 2。也就是说降采样的意思其实是把图像的尺寸缩减一半,行和列同时缩减一半。

    borderType参数表示表示图像边界的处理方式。

    2.pyrUp函数先对图像进行升采样(将图像尺寸行和列方向增大一倍),然后再进行高斯平滑。其函数原型为:pyrUp(src[, dst[, dstsize[, borderType]]]) -> dst

    src参数表示输入图像。

    dst参数表示输出图像,它与src类型、大小相同。

    dstsize参数表示降采样之后的目标图像的大小。在默认的情况下,这个尺寸大小是按照 Size(src.cols2, (src.rows2) 来计算的。如果你自己要指定大小,那么一定要满足下面的条件:

    |dstsize.width - src.cols * 2| ≤ (dstsize.width mod 2); //如果width是偶数,那么必须dstsize.width是src.cols的2倍

    |dstsize.height - src.rows * 2| ≤ (dstsize.height mod 2);

    borderType参数表示表示图像边界的处理方式

    PS:图像大小得像素必须是2得n次方2得n次方??但是我测试得时候,n*n像素也可以

    相关文章

      网友评论

          本文标题:opencv+python -- 图像金字塔

          本文链接:https://www.haomeiwen.com/subject/milswqtx.html