图像梯度

作者: 长歌行夜一 | 来源:发表于2020-07-05 11:56 被阅读0次

图像梯度计算的是图像变化的速度。对于图像的边缘部分，其灰度值变化较大，梯度值也较大。一般情况下，图像梯度计算的是图像的边缘信息。严格来讲，图像梯度计算需要求导数，但图像梯度一般通过计算像素差值来得到梯度的近似值。

1.Sobel算子

Sobel算子是一种离散的微分算子，该算子结合了高斯平滑和微分求导运算。该算子利用局部差分寻找边缘，计算得到一个梯度的近似值。

滤波器通常是指有一幅图像根据像素点(x,y)邻近的区域计算得到另外一幅新图像的算法。滤波器规定了滤波时所采用的形状和该区域内像素值的组成规律。滤波器也被叫做“核”、“窗口”、“算子”、“掩模”、“模板”等。一般信号领域称之为滤波器，数学领域称为“核”。滤波的目标像素点的值等于原始像素值与其周围像素值的加权和，这个叫线性滤波器，基于这种线性核核滤波，就是我们熟悉的卷积。

1.1计算偏导数近似值

对于大小为3 X 3的Sobel算子，其水平方向上的偏导数Gx的计算方式：

$Gx = \begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix} \cdot src$

其垂直方向上的偏导数Gy的计算方式：

$Gy = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix} \cdot src$

注：由于十字路上的像素距离中间值最近，因此将差值权重设为2，其余差值权重设为1

1.2Sobel算子及函数使用

$dst = cv2.Sobel(src,ddepth,dx, dy[,ksize[,scale[,delta[,borderType]]]])$

dst：代表目标图像；

src：代表原始图像；

ddepth：代表输出图像的深度，具体对应关系如下表：

ddepth值

dx：代表x方向上的求导阶数；

dy：代表y方向上的求导阶数；

ksize：代表Sobel核的大小。当为-1时，则会使用Scharr算子进行运算。取值为1，3，5，7，当不输入的时候，默认为3。特殊的，当kSize = 1的时候，采用的模板为1*3或者3*1 而非平时的那些格式；

scale：代表计算导数值时所采用的缩放因子，默认是1，即没有缩放。

delta：代表加在目标图像上的值，默认是0；

borderType：代表边界样式。

在函数cv2.Sobel()中规定，可以将ddepth设置为-1，让处理结果与原始图像保持一致。但如果直接将cv2.Sobel()内ddepth参数的值设为-1，得到的计算结果可能是错的。

实际操作中计算梯度值可能会是负数，如果处理的图像是八位图类型，若设置的ddepth是-1，则所有计算结果中的负数会自动截断为0，发生信息丢失。为避免信息丢失，在计算时需要先使用更高的数据类型cv2.CV_64F，再通过绝对值将其映射为cv2.CV_8U.所以，通常将函数cv2.Sobel()内ddepth参数的值设为cv2.CV_64F。

在OpenCV中，使用cv2.convertScaleAbs(src[,alpha[,beta]])，来对参数取绝对值;

alpha：代表调节系数，该值是可选值，默认为1.

beta：代表调节亮度值，该值是可选值，默认为0.

该函数的作用是将原始图像转换为256色位图。可以表述为：

$dst=saturate(src*alpha+beta)$