CV算法：金字塔（Image Pyramid）

作者: 抬头挺胸才算活着 | 来源:发表于2018-06-14 21:49 被阅读0次

参考资料：
Image Pyramid
斯坦福CS131-1718作业7
CS486-Lecture 11:LoG and DoG Filters

图像通常在空间域上来进行表示，在空间域上我们可以进行很多滤波操作，滤波一般是操作点及其附近的信息。但是图片包含很多复杂的信息，通常很难在空间域上就处理好。

我们还可以在频域上对图像进行操作。但频域主要的问题会混合从图片其他地方的频率信息，这叫做“局部性的损失”（loss of locality），大部分情况下，我们不想在我们面部细节上混淆一些背景中草的信息。

为了利用空间域和频域的信息，我们发明了空频域（spatial-frequency），可以既分离频率成分，又可以保留局部信息。

图像金字塔实际上将图片表示为一系列不同频率的图像，这些图像保留了不同的细节信息，因为这个特性，又叫多分辨率或者多尺度。

Comparison of each layers in the same size

上一步的金字塔相减得到，注意右边黑黑的才是。因为G1是要比G0小的，所以G0要扩大后再相减。L0实际上就是被滤掉的高频信息，现在回来啦。L0更细节，更高频。

金字塔就是另外一种表示图片的方式，结合了空间域和频域的优点。

冈萨雷斯书上说，在模式是被中，高分辨率的图像用来识别一些细节，低分辨率的图像用来识别一些大的结构。
在HOG识别人脸中，人脸因为大小不同可能跟计算出来错误，所以这里缩放多张图片，依次计算，得到分数最大的才是。

网友评论

本文标题：CV算法：金字塔（Image Pyramid）

本文链接：https://www.haomeiwen.com/subject/hmkueftx.html

CV算法：金字塔（Image Pyramid）