原文地址:https://docs.opencv.org/3.4.1/df/dd2/tutorial_py_surf_intro.html
本文概述
- SURF 基础知识
- OpenCV 中的 SURF
理论:
在上一章中,我们已经介绍了 SIFT 算法对关键点的检测和描述。但 SIFT 速度相对较慢,人们需要更快的版本。在2016年,Bay, H., Tuytelaars, and Van Gool, L 三人一起发布了另一篇论文 "SURF: Speeded Up Robust Features",文中介绍了一种叫 SURF 的新算法。顾名思义,它是 SIFT 算法的加速版。
在 SIFT 中,Lowe 用高斯差分近似拉普拉斯高斯分布的方式来寻找尺度空间。SURF 用 Box Filter 逼近 LoG,如下图所示。这种近似的一大优点是,利用积分图像更容易计算与盒式滤波器的卷积,它可以在不同的尺度下并行完成。 SURF 依赖于 Hessian 矩阵的行列式和位置的行列式。
image.png对于定向分配,SURF 使用水平和垂直方向的小波响应来确定 6s 的邻域。适当的高斯权重也适用于它。然后将它们绘制在下图中给出的空间中。通过计算角度 60 度的滑动取向窗口内的所有响应的总和来估计主导方向。有趣的是,小波响应可以很容易地在任何尺度上用积分图像找出来。对于许多应用来说,不需要旋转不变性,所以不需要找到这个方向,从而加快了处理速度。 SURF 提供了称为 Upright-SURF 或 U-SURF 的模式。该模式可以有效提高计算速度,并且稳定性高达±15∘。OpenCV 可以通过 upright 属性来调整计算方向:
upright = 0 表示需要计算方向;
upright = 1 表示不用该计算方向;
image.png
对于特征描述,SURF 采用水平和垂直方向的小波响应(Wavelet responses)。在尺寸为 s 的关键点周围拍摄 20s×20s 的邻域。它分为 4x4 个分区域。对于每个子区域,采用水平和垂直小波响应,并形成矢量,其中 v=(∑dx,∑dy,∑|dx|,∑|dy|)。这表示SURF特征描述符总共有64个维度的矢量。降低维度可以提高计算速度和匹配速度,反之可以提高精确性。
为了更加精确,SURF 特征描述符有128维版。dx 和 |dx| 的总和分别计算 dy <0 和 dy≥0。同样,dy 和 |dy| 的和根据 dx 的符号分割,从而使特征的数量加倍。它不会增加很多计算复杂性。OpenCV 可以通过改变 extended 属性来调整矢量维数:
extended = 0 表示 64 维;
extended = 1 表示 128 维(默认是 128 维)
另一个重要的改进是使用拉普拉斯(Laplacian)信号(Hessian 矩阵的迹线)作为潜在的兴趣点。它不会增加计算成本,因为它在检测期间已经被计算出来。拉普拉斯信号将暗色背景上的亮斑与相反的情况区分开来。在匹配阶段,我们只比较具有相同类型对比度的特征(如下图所示)。这个最小的信息可以更快的做匹配,而且不会降低描述符(descriptor)的性能。
image.png简而言之,SURF 增加了很多功能来提高每一步的速度。分析表明它比SIFT 快3倍,而性能可与 SIFT 相媲美。SURF 善于处理模糊和旋转的图像,但不擅长处理视点(viewpoint)变化和照明(illumination)变化。
OpenCV 中的 SURF
OpenCV 提供了 SIFT 和 SURF 功能。你可以通过添加一些可选参数(如:64/128-dim 的描述符,Upright / Normal)来初始化一个 SURF 对象。所有的细节在文档中都有详细描述。然后,就像我们使用 SIFT 一样,我们可以用 SURF.detect()
, SURF.compute()
等方法查找关键点和描述符。
以下代码展示了如何用 SURF 查找关键点、获取描述符:
# 读取演示图片
img = cv.imread('fly.png',0)
# 创建 SURF 对象,你可以在此时或后续指定参数
# 此处我设置了 Hessian 阈值为 400
surf = cv.xfeatures2d.SURF_create(400)
# 直接获取关键点和描述符
kp, des = surf.detectAndCompute(img,None)
# 展示获取到的关键点数量
print(len(kp))
9988 个关键点对于一张图片来说太多了,我们将它减少到 50 个左右以便在图像上绘制它。在匹配时,我们可能需要所有的点,但不是不用。所以我们增加 Hessian 阈值。
# 我们将 Hessian 阈值设为 50000(此刻只是为了演示,实际中最好设为 300-500 )
surf.setHessianThreshold(50000)
# 展示获取到的关键点数量
print(len(kp))
经过查看,此时特征点已经小于50个了,我们来看看效果图:
img2 = cv.drawKeypoints(img,kp,None,(255,0,0),4)
plt.imshow(img2),plt.show()
看到下面的结果。你可以看到 SURF 更像是一个blob探测器。它检测到蝴蝶翅膀上的白色斑点。您可以使用其他图像进行测试。
image.png
现在我们用 U-SURF,以便它找不到方向。
surf.setUpright(True)
如下图,所有的方向都显示在同一个方向。U-SURF 速度更快。如果您正在处理方向不敏感的场景,用 U-SURF会更好(如全景拼接等)。
image.png
最后,我们检查描述符大小,如果它只有64-dim,则将其更改为128。
surf.setExtended(True)
网友评论