参考资料:
Image Pyramid
斯坦福CS131-1718作业7
CS486-Lecture 11:LoG and DoG Filters
-
Why we need these Pyramids?
图像通常在空间域上来进行表示,在空间域上我们可以进行很多滤波操作,滤波一般是操作点及其附近的信息。但是图片包含很多复杂的信息,通常很难在空间域上就处理好。
我们还可以在频域上对图像进行操作。但频域主要的问题会混合从图片其他地方的频率信息,这叫做“局部性的损失”(loss of locality),大部分情况下,我们不想在我们面部细节上混淆一些背景中草的信息。
为了利用空间域和频域的信息,我们发明了空频域(spatial-frequency),可以既分离频率成分,又可以保留局部信息。
-
What is exactly this Pyramid?
图像金字塔实际上将图片表示为一系列不同频率的图像,这些图像保留了不同的细节信息,因为这个特性,又叫多分辨率或者多尺度。
-
How to construct this Pyramid?
第一步:Guassian Pyramid
Comparison of each layers in the same size
第二步:Laplacian Pyramid
上一步的金字塔相减得到,注意右边黑黑的才是。因为G1是要比G0小的,所以G0要扩大后再相减。L0实际上就是被滤掉的高频信息,现在回来啦。L0更细节,更高频。
-
Reconstruction
-
总结
金字塔就是另外一种表示图片的方式,结合了空间域和频域的优点。
-
应用
压缩
识别不同大小的人脸
冈萨雷斯书上说,在模式是被中,高分辨率的图像用来识别一些细节,低分辨率的图像用来识别一些大的结构。
在HOG识别人脸中,人脸因为大小不同可能跟计算出来错误,所以这里缩放多张图片,依次计算,得到分数最大的才是。
网友评论