美文网首页计算机视觉专题组
以图搜图实现原理以及相关算法学习

以图搜图实现原理以及相关算法学习

作者: 少寨主的互联网洞察 | 来源:发表于2018-03-06 15:11 被阅读990次

    最简单的搜索算法:均值hash

    其工作流程如下:

    • 缩小尺寸: 去除高频和细节的最快方法是缩小图片,将图片缩小到8x8的尺寸,总共64个像素。不要保持纵横比,只需将其变成8*8的正方形。这样就可以比较任意大小的图片,摒弃不同尺寸、比例带来的图片差异。

    • 简化色彩: 将8*8的小图片转换成灰度图像。

    • 计算平均值: 计算所有64个像素的灰度平均值。

    • 比较像素的灰度: 将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。

    • 计算hash值: 将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。

    一点解释: 如果图片放大或缩小,或改变纵横比,结果值也不会改变。增加或减少亮度或对比度,或改变颜色,对hash值都不会太大的影响
    最大优点:-----计算速度快!

    那么完成了以上步骤,一张图片就相当于有了自己的"指纹"了,然后就是计算不同位的个数---汉明距离
    如果汉明距离小于5,则表示有些不同,但比较相近,如果汉明距离大于10则表明完全不同的图片。

    缺点: 但受均值的影响非常大。如对图像进行伽马校正或直方图均衡就会影响均值,从而影响最终的hash值。

    改良版:pHash
    pHash的工作过程如下:

    • (1)缩小尺寸:pHash以小图片开始,但图片大于88,3232是最好的。这样做的目的是简化了DCT的计算,而不是减小频率。

    • (2)简化色彩:将图片转化成灰度图像,进一步简化计算量。

    • (3)计算DCT:计算图片的DCT变换,得到32*32的DCT系数矩阵。

    • (4)缩小DCT:虽然DCT的结果是3232大小的矩阵,但我们只要保留左上角的88的矩阵,这部分呈现了图片中的最低频率。

    • (5)计算平均值:如同均值哈希一样,计算DCT的均值。

    • (6)计算hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或1的64位的hash值,大于等于DCT均值的设为”1”,小于DCT均值的设为“0”。组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。

    优点只要图片的整体结构保持不变,hash结果值就不变。能够避免伽马校正或颜色直方图被调整带来的影响。
    与均值哈希一样,pHash同样可以用汉明距离来进行比较。

    相关文章

      网友评论

        本文标题:以图搜图实现原理以及相关算法学习

        本文链接:https://www.haomeiwen.com/subject/zfbqfftx.html