最近在学习OpenCV,在自己实现rober,LOG等算子卷积的时候,遇到了一些坑,先上代码
import cv2
import numpy as np
import os
import copy
# 边缘检测
filename = os.path.abspath('第二次作业/lena.jpg')
lena = cv2.imread(filename)
# 实现robert,Sobel和LOG边缘提取
gray = cv2.imread(os.path.abspath('第二次作业/bear.jpg'),0)
gray = cv2.cvtColor(lena,cv2.COLOR_BGR2GRAY)
w,h = gray.shape
robert_img = gray.copy()
sobel_img = gray.copy()
log_img = gray.copy()
robertx,roberty = np.array([-1,-1,1,1]),np.array([0,1,-1,0])
sobel = np.array([1,0,-1,2,0,-2,1,0,-1])
LOG = np.array([-2,-4,-4,-4,-2,-4,0,8,0,-4,-4,8,24,8,-4,-4,0,8,0,-4,-2,-4,-4,-4,-2])
for i in range(w-2):
for j in range(h-2):
origin1 = np.array(gray[i:i+2,j:j+2]).flatten()
origin2 = np.array(gray[i:i+3,j:j+3]).flatten()
origin3 = np.array(gray[i:i+5,j:j+5]).flatten()
value = abs(origin1.dot(robertx))
robert_img[i][j] = value
if value != robert_img[i,j]:
print(value,'-----',robert_img[i,j])
sobel_img[i][j] = origin2.dot(sobel)
if(i<w-4 and j<h-4):
value = origin3.dot(LOG)
log_img[i][j] = value
cv2.imshow('origin',gray)
cv2.imshow('robert',robert_img)
cv2.imshow('sobel',sobel_img)
cv2.imshow('LOG',log_img)
cv2.imshow('sobelopen',cv2.Sobel(gray,cv2.CV_64F,1,0,ksize=3))
cv2.waitKey()
cv2.destroyAllWindows()
在建立新的图片用于存储计算好的结果时,我使用了如下方法
robert_img = gray.copy()
sobel_img = gray.copy()
log_img = gray.copy()
结果显示如下:
![](https://img.haomeiwen.com/i6000471/ca3726b8a32525f3.png)
可以看到LOG算子的计算结果明显不对,使用如下方式创建图像:
robert_img = np.empty(gray.shape)
sobel_img = np.empty(gray.shape)
log_img = np.empty(gray.shape)
结果如下:
![](https://img.haomeiwen.com/i6000471/3e130465ae5bc43c.png)
再换成如下方式:
robert_img = np.empty_like(gray)
sobel_img = np.empty_like(gray)
log_img = np.empty_like(gray)
![](https://img.haomeiwen.com/i6000471/812e9988971af810.png)
结果和第一个一样的
只是改变了创建图片的方式,怎么结果就这么不一样呢?
经过仔细的调试,发现,由于不同算子经过卷积计算后,结果的值不一定在[0,255]之间,所以在将结果赋值给创建的数据时,会将结果自动转成数据的类型,而转换的结果并不是我们想要的,所以出现了错误。
这里就提一下np.empty()和np.empty_like()的区别,前者如果没有指定数据类型(参数dtype进行设置),那么会默认为浮点类型,而后者需要传入一个存在的数据,所以新建的数据会设定成这个数据的类型。
那么初始化为浮点的类型,最后结果为什么显示是错误的呢?这里就是imshow函数的一个坑,我们先看看这个函数在python中的注释:
![](https://img.haomeiwen.com/i6000471/158212f8b9ca2385.png)
大概翻译一下,就是说如果数据类型是uint8,那么将直接显示,如果是16位或者32位整型,那么将该值除以256,得到[0,255]的范围进行显示,如果是一个浮点数,那么将其乘以255,那么[0,1]就转换成[0,255]的值进行显示。
所以,就出现了之前代码出现的问题。但是这里的描述仍然不够详尽,比如16位整型值是负的怎么处理,浮点数大于1的怎么处理,查了很多地方都没有看看,如果有谁知道,麻烦告诉我一下。
网友评论