美文网首页
OpenCV官网文档(核心操作)——效果评估和改进技术

OpenCV官网文档(核心操作)——效果评估和改进技术

作者: zqyadam | 来源:发表于2020-03-01 12:23 被阅读0次

目标

在图像处理中,由于每秒要处理大量操作,因此必须使代码不仅提供正确的解决方案,而且还必须以最快的方式提供它。因此,在本章中,您将学习:

除了OpenCV,Python还提供了一个time模块,这有助于衡量执行时间。另一个profile模块有助于获取有关代码的详细报告,例如代码中每个函数花费了多少时间,调用了函数的次数等等。但是,如果您使用的是IPython,则所有这些功以用户友好的方式集成了。我们将看到一些重要的信息,有关更多详细信息,请查看“ 其他资源”部分中的链接。

使用OpenCV衡量性能

cv.getTickCount函数返回调用此函数之后,参照事件(像的时刻该机器接通)的时钟周期的数目。因此,如果在函数执行之前和之后调用它,则会获得用于执行函数的时钟周期数。

cv.getTickFrequency函数返回时钟周期的频率,或每秒时钟周期的数目。因此,要找到执行时间(以秒为单位),您可以执行以下操作:

e1 = [cv.getTickCount](http://opencvdoc.hihi.site:5050/db/de0/group__core__utils.html#gae73f58000611a1af25dd36d496bf4487)()

# your code execution

e2 = [cv.getTickCount](http://opencvdoc.hihi.site:5050/db/de0/group__core__utils.html#gae73f58000611a1af25dd36d496bf4487)()

time = (e2 - e1)/ [cv.getTickFrequency](http://opencvdoc.hihi.site:5050/db/de0/group__core__utils.html#ga705441a9ef01f47acdc55d87fbe5090c)()

我们将通过以下示例进行演示。以下示例应用中位数过滤,其内核的奇数范围为5到49。(不必担心结果会是什么样-这不是我们的目标):

img1 = cv.imread('messi5.jpg')
e1 = cv.getTickCount()
for i in range(5,49,2):
    img1 = cv.medianBlur(img1,i)
e2 = cv.getTickCount()
t = (e2 - e1)/cv.getTickFrequency()
print( t )
# Result I got is 0.521107655 seconds

注意
您可以使用时间模块执行相同的操作。代替cv.getTickCount,使用time.time()函数。然后取两次的差。

OpenCV中的默认优化

许多OpenCV函数已使用SSE2,AVX等进行了优化。它还包含未优化的代码。因此,如果我们的系统支持这些函数,则应该利用它们(几乎所有现代处理器都支持它们)。默认在编译时启用。因此,如果已启用,OpenCV将运行优化的代码,否则将运行未优化的代码。您可以使用cv.useOptimized()来检查是否启用/禁用它,并使用cv.setUseOptimized()来启用/禁用它。让我们看一个简单的例子。

# check if optimization is enabled
In [5]: cv.useOptimized()
Out[5]: True
In [6]: %timeit res = cv.medianBlur(img,49)
10 loops, best of 3: 34.9 ms per loop
# Disable it
In [7]: cv.setUseOptimized(False)
In [8]: cv.useOptimized()
Out[8]: False
In [9]: %timeit res = cv.medianBlur(img,49)
10 loops, best of 3: 64.1 ms per loop

如您所见,优化的中值滤波比未优化的版本快2倍。如果检查其来源,则可以看到中值滤波是SIMD优化的。因此,您可以使用它在代码顶部启用优化(请记住默认情况下已启用)。

在IPython中评估性能

有时您可能需要比较两个相似操作的性能。IPython为您提供了一个神奇的命令timeit来执行此操作。它会多次运行代码以获得更准确的结果。再说一次,它适合于测试单行代码。

例如,您知道以下哪个加法更好,x = 5; y = x2,x = 5; y = xx,x = np.uint8([5]); y = xx,或y = np.square(x)?我们将在IPython shell中使用timeit进行查找。

In [10]: x = 5
In [11]: %timeit y=x**2
10000000 loops, best of 3: 73 ns per loop
In [12]: %timeit y=x*x
10000000 loops, best of 3: 58.3 ns per loop
In [15]: z = np.uint8([5])
In [17]: %timeit y=z*z
1000000 loops, best of 3: 1.25 us per loop
In [19]: %timeit y=np.square(z)
1000000 loops, best of 3: 1.16 us per loop

您可以看到,x = 5;y = x*x最快,比Numpy快20倍左右。如果您还考虑数组的创建,它可能会快100倍。酷吧?(大量开发人员正在研究此问题)

注意
Python标量运算比Numpy标量运算快。因此,对于包含一两个元素的运算,Python标量比Numpy数组好。当数组的大小稍大时,Numpy具有优势。

我们将再尝试一个示例。这次,我们将比较同一图像的cv.countNonZero()np.count_nonzero()性能。

In [35]: %timeit z = cv.countNonZero(img)
100000 loops, best of 3: 15.8 us per loop
In [36]: %timeit z = np.count_nonzero(img)
1000 loops, best of 3: 370 us per loop

可以看到,OpenCV函数比Numpy函数快25倍。

注意
通常,OpenCV函数比Numpy函数要快。因此,对于相同的操作,首选OpenCV功能。但是,可能会有例外,尤其是当Numpy处理视图而不是副本时。

更多IPython魔术命令

还有其他一些魔术命令可以用来衡量性能,性能分析,行性能分析,内存测量等。它们都有很好的文档记录。因此,此处仅提供指向这些文档的链接。建议有兴趣的读者尝试一下。

性能优化技术

有几种技术和编码方法可以充分利用Python和Numpy的性能。此处仅记录相关内容,并链接到重要资源。这里要注意的主要事情是,首先尝试以一种简单的方式实现该算法。工作正常后,分析它,找到瓶颈并进行优化。

  1. 尽可能避免在Python中使用循环,尤其是双/三重循环等。它们本来就很慢。
  2. 由于Numpy和OpenCV已针对向量运算进行了优化,因此将算法/代码向量化到最大程度。
  3. 利用缓存一致性。
  4. 除非有必要,否则切勿复制数组。尝试改用视图。数组复制是一项昂贵的操作。

如果执行完所有这些操作后代码仍然很慢,或者不可避免地需要使用大循环,请使用Cython等其他库来使其更快。

其他资源

  1. Python优化技术
  2. Scipy讲义- 高级Numpy
  3. IPython中的时序和性能分析

练习题

相关文章

网友评论

      本文标题:OpenCV官网文档(核心操作)——效果评估和改进技术

      本文链接:https://www.haomeiwen.com/subject/dunxkhtx.html