本文主要内容来自于 OpenCV-Python 教程 的 OpenCV 中的图像处理 部分,这部分的全部主要内容如下:
-
学习在不同色彩空间之间改变图像。另外学习跟踪视频中的彩色对象。
-
学习对图像应用不同的几何变换,比如旋转、平移等。
-
学习使用全局阈值、自适应阈值、Otsu 的二值化等将图像转换为二值图像。
-
学习模糊图像,使用自定义内核过滤图像等。
-
了解形态学变换,如侵蚀、膨胀、开放、闭合等。
-
学习寻找图像渐变、边缘等。
-
学习通过 Canny 边缘检测寻找边缘。
-
学习关于图像金字塔的内容,以及如何使用它们进行图像混合。
-
所有关于 OpenCV 中的轮廓的内容。
-
所有关于 OpenCV 中的直方图的内容。
-
在 OpenCV 中遇到不同的图像变换,如傅里叶变换、余弦变换等。
-
学习使用模板匹配在图像中搜索对象。
-
学习在一幅图像中探测线。
-
学习在一幅图像中探测圆。
-
学习使用分水岭分割算法分割图像。
-
学习使用 GrabCut 算法提取前景
目标
在本章中:
- 我们将学习不同的形态学操作,如腐蚀、膨胀、开、闭等。
- 我们将看到不同的函数,例如:cv.erode(),cv.dilate(),cv.morphologyEx() 等等。
理论
形态变换是基于图像形状的一些简单操作。它通常在二值图像上操作。它需要两个输入,一个是我们的原始图像,第二个称为 结构元素 或内核,其决定了操作的性质。 两个基本的形态学操作是侵蚀和膨胀。然后它的变体形式,如 Opening,Closing,Gradient 等也开始发挥作用。我们将在下图的帮助下一一看看它们:
1. 侵蚀
蚀的基本思想就像土壤侵蚀一样,它侵蚀了前景物体的边界(总是尽量保持前景为白色)。那么它有什么作用呢?内核在图像中滑动(如在 2D 卷积中)。只有当内核下的所有像素都为 1 时,原始图像中的一个像素(1 或 0)才会被认为是 1,否则它会被侵蚀(变为 0)。
所以发生的情况是,边界附近的所有像素都将根据内核的大小被丢弃。因此,前景物体的厚度或大小会减小,或者只是图像中的白色区域减小。它对于去除小的白噪声(正如我们在色彩空间章节中所见)、分离两个连接的对象等很有用。
在这里,作为一个例子,我们使用一个 5x5 的内核,其中全是 1。让我们看看它是如何工作的:
import cv2 as cv
import numpy as np
def erosion():
img = cv.imread("/home/zhangsan/j.png", 0)
kernel = np.ones((5, 5), np.uint8)
erosion = cv.erode(img, kezhangsanrnel, iterations=1)
edge = np.full((img.shape[0], 3, 1), 255, np.uint8);
images = [img, edge, erosion]
dest = cv.hconcat(images)
cv.imshow("Image", dest)
cv.waitKey(-1)
if __name__ == "__main__":
erosion()
结果如下:
Image
2. 膨胀
它与侵蚀完全相反。在这里,如果内核下的元素中至少有一个值为 '1',则像素元素值为 '1'。因此它增加图像中的白色区域,或者增加前景对象的大小。通常,在去除噪声等情况下,侵蚀之后是膨胀。因为,侵蚀消除白噪声,但它也缩小了我们的对象。所以我们扩张它。由于噪音消失了,它们不会回来,但我们的对象面积增加了。它也可用于连接对象的损坏部分。
dilation = cv.dilate(img, kernel, iterations=1)
结果如下:
Image
3. 开
开只是 侵蚀后膨胀 的另一个名称。正如我们上面解释的那样,它在消除噪音方面很有用。这里我们使用函数 cv.morphologyEx()。
def opening():
img = cv.imread("/home/hanpfei/j.png", 0)
for i in range(50):
row = random.randint(0, img.shape[0] - 1)
col = random.randint(0, img.shape[1] - 1)
img[row][col] = 255
kernel = np.ones((5, 5), np.uint8)
opening = cv.morphologyEx(img, cv.MORPH_OPEN, kernel)
edge = np.full((img.shape[0], 3, 1), 255, np.uint8);
images = [img, edge, opening]
dest = cv.hconcat(images)
cv.imshow("Image", dest)
cv.waitKey(-1)
要处理的图像中如果包含一些白色的噪声像素点,效果会比较明显。这里先给输入图像增加了一些白色的噪声像素点。结果如下:
Image4. 闭
闭是开的逆操作,膨胀后侵蚀。它对于闭合前景对象内的小孔,或对象上的小黑点很有用。
def closing():
img = cv.imread("/home/hanpfei/j.png", 0)
for i in range(5000):
row = random.randint(0, img.shape[0] - 1)
col = random.randint(0, img.shape[1] - 1)
img[row][col] = 0
kernel = np.ones((5, 5), np.uint8)
closing = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel)
edge = np.full((img.shape[0], 3, 1), 255, np.uint8);
images = [img, edge, closing]
dest = cv.hconcat(images)
cv.imshow("Image", dest)
cv.waitKey(-1)
if __name__ == "__main__":
closing()
这里同样先在输入图像上制造一些噪声点,不过这次是黑色噪声像素点。由于大多数黑色噪声点会落在黑色的背景区域内而看不出效果,所以这里制造更多的噪声点。最终的结果如下:
Image
5. 形态梯度
它是一幅图像的膨胀和侵蚀之间的差值。
结果将看起来像是对象的轮廓。
gradient = cv.morphologyEx(img, cv.MORPH_GRADIENT, kernel)
结果如下:
Image
6. 礼帽
它是输入图像和图像的开的插值。下面的示例是针对 9x9 内核完成的。
def top_hat():
img = cv.imread("/home/hanpfei/j.png", 0)
kernel = np.ones((9, 9), np.uint8)
tophat = cv.morphologyEx(img, cv.MORPH_TOPHAT, kernel)
edge = np.full((img.shape[0], 3, 1), 255, np.uint8);
images = [img, edge, tophat]
dest = cv.hconcat(images)
cv.imshow("Image", dest)
cv.waitKey(-1)
结果如下:
Image
7. 黑帽
它是输入图像和图像的闭的插值。下面的示例是针对 9x9 内核完成的。
tophat = cv.morphologyEx(img, cv.MORPH_BLACKHAT, kernel)
结果如下:
Image
结构元素
我们在 Numpy 的帮助下手动创建前面的示例中的结构元素。它是矩形的。但在某些情况下,你可能需要 椭圆形/圆形 的内核。所以为了这个目的,OpenCV 有一个函数,cv.getStructuringElement()。我们只需传入内核的形状和大小,就可以得到想要的内核。
# Rectangular Kernel
>>> cv.getStructuringElement(cv.MORPH_RECT,(5,5))
array([[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1]], dtype=uint8)
# Elliptical Kernel
>>> cv.getStructuringElement(cv.MORPH_ELLIPSE,(5,5))
array([[0, 0, 1, 0, 0],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1],
[0, 0, 1, 0, 0]], dtype=uint8)
# Cross-shaped Kernel
>>> cv.getStructuringElement(cv.MORPH_CROSS,(5,5))
array([[0, 0, 1, 0, 0],
[0, 0, 1, 0, 0],
[1, 1, 1, 1, 1],
[0, 0, 1, 0, 0],
[0, 0, 1, 0, 0]], dtype=uint8)
其它资源
- HIPR2 的 Morphological Operations
练习
参考文档
Done.
网友评论