美文网首页video
CV算法:金字塔(Image Pyramid)

CV算法:金字塔(Image Pyramid)

作者: 抬头挺胸才算活着 | 来源:发表于2018-06-14 21:49 被阅读0次

    参考资料:
    Image Pyramid
    斯坦福CS131-1718作业7
    CS486-Lecture 11:LoG and DoG Filters

    • Why we need these Pyramids?

    图像通常在空间域上来进行表示,在空间域上我们可以进行很多滤波操作,滤波一般是操作点及其附近的信息。但是图片包含很多复杂的信息,通常很难在空间域上就处理好。

    我们还可以在频域上对图像进行操作。但频域主要的问题会混合从图片其他地方的频率信息,这叫做“局部性的损失”(loss of locality),大部分情况下,我们不想在我们面部细节上混淆一些背景中草的信息。

    为了利用空间域和频域的信息,我们发明了空频域(spatial-frequency),可以既分离频率成分,又可以保留局部信息。

    • What is exactly this Pyramid?

    图像金字塔实际上将图片表示为一系列不同频率的图像,这些图像保留了不同的细节信息,因为这个特性,又叫多分辨率或者多尺度。


    • How to construct this Pyramid?

    第一步:Guassian Pyramid


    Comparison of each layers in the same size

    第二步:Laplacian Pyramid

    上一步的金字塔相减得到,注意右边黑黑的才是。因为G1是要比G0小的,所以G0要扩大后再相减。L0实际上就是被滤掉的高频信息,现在回来啦。L0更细节,更高频。


    • Reconstruction

    • 总结

    金字塔就是另外一种表示图片的方式,结合了空间域和频域的优点。

    • 应用

    压缩

    识别不同大小的人脸

    冈萨雷斯书上说,在模式是被中,高分辨率的图像用来识别一些细节,低分辨率的图像用来识别一些大的结构。
    在HOG识别人脸中,人脸因为大小不同可能跟计算出来错误,所以这里缩放多张图片,依次计算,得到分数最大的才是。



    相关文章

      网友评论

        本文标题:CV算法:金字塔(Image Pyramid)

        本文链接:https://www.haomeiwen.com/subject/hmkueftx.html