美文网首页
[OpenCV官方教程中文版-段力辉译]-图像的二值化-cv2.

[OpenCV官方教程中文版-段力辉译]-图像的二值化-cv2.

作者: 六千宛 | 来源:发表于2021-06-18 12:26 被阅读0次

    1. 什么是图像的二值化

      将图像上的[像素](https://baike.baidu.com/item/%E5%83%8F%E7%B4%A0/95084)点的[灰度值](https://baike.baidu.com/item/%E7%81%B0%E5%BA%A6%E5%80%BC/10259111)设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。
    
      图像的二值化使图像中数据量大为减少,从而能凸显出目标的轮廓。
    

    2. 实现函数- cv2.threshold()、cv2.adaptiveThreshold()

    2.1 全局阈值-cv2.threshold()

    • 参数如下:cv2.threshold(src, thresh, maxval, type)
    • 参数说明: 1. src 源图像,必须是单通道 2. thresh 分类阈值 3. maxval 高于(低于)阈值时赋予的新值 4. type 阈值处理模式
    • 返回值: 1.retval 得到的阈值 2. dst 阈值化后的图像
    • 阈值处理模式:cv2.THRESH_BINARY、cv2.THRESH_BINARY_INV、cv2.THRESH_TRUNC、
      cv2.THRESH_TOZERO、cv2.THRESH_TOZERO_INV,具体说明如下:
      - 1. cv2.THRESH—BINARY
      如果像素值大于阈值,像素值就会被设为参数3; 小于等于阈值,设定为0
      - 2. cv2.THRESH_BINARY_INV
      这个是上面一种情况的反转: 如果像素值大于阈值,像素值为0; 小于等于阈值,设定为参数3
      - 3. cv2.THRESH_TRUNC
      如果像素大于阈值,设定为阈值;小于等于阈值,保持原像素值
      - 4. cv2.THRESH_TOZERO
      大于阈值,保持原像素值; 小于等于,设定为0
      - 5. cv2.THRESH_TOZERO_INV
      与上一种相反:大于阈值,设定为0;小于等于,保持原像素值

    代码如下:

    def threshold_simple(image):
        img = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
        ret, thresh1 = cv.threshold(img, 127, 255, cv.THRESH_BINARY)
        ret, thresh2 = cv.threshold(img, 127, 255, cv.THRESH_BINARY_INV)
        ret, thresh3 = cv.threshold(img, 127, 255, cv.THRESH_TRUNC)
        ret, thresh4 = cv.threshold(img, 127, 255, cv.THRESH_TOZERO)
        ret, thresh5 = cv.threshold(img, 127, 255, cv.THRESH_TOZERO_INV)
        titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
        images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
     
        for i in range(6):
            plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')  # 将图像按2x3铺开
            plt.title(titles[i])
            plt.xticks([]), plt.yticks([])
     
        plt.show()
    

    2.2 自适应阈值 -cv2.adaptiveThreshold()

    自适应阈值可以看成一种局部性的阈值,通过规定一个区域大小,比较这个点与区域大小里面像素点的平均值(或者其他特征)的大小关系确定这个像素点是属于黑或者白(如果是二值情况)。该函数需要填6个参数:

    • 第一个原始图像
    • 第二个像素值上限
    • 第三个自适应方法Adaptive Method:
    • — cv2.ADAPTIVE_THRESH_MEAN_C :领域内均值
    • —cv2.ADAPTIVE_THRESH_GAUSSIAN_C :领域内像素点加权和,权重为一个高斯窗口
    • 第四个值的赋值方法:只有cv2.THRESH_BINARY 和cv2.THRESH_BINARY_INV
    • 第五个Block size:规定领域大小(一个正方形的领域),计算邻域时的领邻域大小,必须为奇数;当blockSize越大,参与计算阈值的区域也越大,细节轮廓就变得越少,整体轮廓越粗越明显
    • 第六个常数C,阈值等于均值或者加权值减去这个常数,得到的就是最终阈值。当C越大,每个像素点的N*N邻域计算出的阈值就越小,中心点大于这个阈值的可能性也就越大,设置成255的概率就越大,整体图像白色像素就越多,反之亦然。
      这种方法理论上得到的效果更好,相当于在动态自适应的调整属于自己像素点的阈值,而不是整幅图像都用一个阈值。

    代码如下:

    def threshold_adaptive(image):
        img = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
        # 中值滤波
        img = cv.medianBlur(img, 5)
     
        ret, th1 = cv.threshold(img, 127, 255, cv.THRESH_BINARY)
        # 11 为 Block size, 2 为 C 值
        th2 = cv.adaptiveThreshold(img, 255, cv.ADAPTIVE_THRESH_MEAN_C, cv.THRESH_BINARY, 11, 2)
        th3 = cv.adaptiveThreshold(img,255,cv.ADAPTIVE_THRESH_GAUSSIAN_C, cv.THRESH_BINARY, 11, 2)
     
        titles = ['Original Image', 'Global Threshold (v = 127)', 'Adaptive Mean Threshold', 'Adaptive Gaussian Threshold']
        images = [img, th1, th2, th3]
     
        for i in range(4):
            plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
            plt.title(titles[i])
            plt.xticks([]), plt.yticks([])
     
        plt.show()
    
    
    import cv2
    import numpy as np
     
    blocksize = 3
    C=0
    def adaptive_demo(gray, blocksize, C):
        binary = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, blocksize, C)
        # binary = cv2.GaussianBlur(binary, (15,15), 0)
        cv2.imshow('binary', binary)
     
    def C_changed(value):
        global gray
        global blocksize
        global C
        C = value - 30
        print('C:', C)
        adaptive_demo(gray, blocksize, C)
     
    def blocksize_changed(value):
        global gray
        global blocksize
        global C
        blocksize = 2 * value + 1
     
        print('blocksize:', blocksize)
        adaptive_demo(gray, blocksize, C)
     
    if __name__ == "__main__":
        image_path = './img/1.jpg'
        img = cv2.imread(image_path)
     
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
     
        adaptive_demo(gray, 3, 0)
        cv2.createTrackbar('C', 'binary',0, 60, C_changed)
        cv2.createTrackbar('blocksize', 'binary',1, 20, blocksize_changed)
     
        cv2.waitKey(0)
    

    在使用全局阈值时,随便给了一个数来做阈值,那怎么知道选取的这个数的好坏呢?答案就是不停的尝试。如果是一副双峰图像(简单来说双峰图像是指图像直方图中存在两个峰)呢?我们岂不是应该在两个峰 之间的峰谷选一个值作为阈值?这就是 Otsu 二值化要做的。简单来说就是对 一副双峰图像自动根据其直方图计算出一个阈值。(对于非双峰图像,这种方法得到的结果可能会不理想)。

    这里用到到的函数还是 cv2.threshold(),但是需要多传入一个参数 (flag):cv2.THRESH_OTSU。这时要把阈值设为 0。然后算法会找到最优阈值,这个最优阈值就是返回值 retVal。如果不使用 Otsu 二值化,返回的 retVal 值与设定的阈值相等。

    下面的例子中,输入图像是一副带有噪声的图像。第一种方法,设127为全局阈值。第二种方法,我们直接使用 Otsu 二值化。第三种方法,我 们首先使用一个 5x5 的高斯核除去噪音,然后再使用 Otsu 二值化。看看噪音去除对结果的影响有多大。

    
    import cv2
    import numpy as np
    from matplotlib import pyplot as plt
     
     
    img = cv2.imread('F:/OTSnoise.png',0)
    #全局阈值
    ret1, th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)
    #OTS阈值
    ret2, th2 = cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
    #(5,5)为高斯核的大小,0为标准差
    blur = cv2.GaussianBlur(img,(5,5),0)
    #阈值一定设为0
    ret3, th3 = cv2.threshold(blur, 0, 255, cv2.THRESH_OTSU)
     
    images = [img, 0, th1,
              img, 0, th2,
              blur, 0, th3]
     
    titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
              'Original Noisy Image','Histogram',"Otsu's Thresholding",
              'Gaussian filtered Image','Histogtam',"Otus's Thresholding"]
     
    for i in xrange(3):
        plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
        plt.title(titles[i*3]),plt.xticks([]),plt.yticks([])
        plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)#plt.hist是画直方图
        plt.title(titles[i*3+1]),plt.xticks([]),plt.yticks([])
        plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
        plt.title(titles[i*3+2]),plt.xticks([]),plt.yticks([])
     
    plt.show()
    
    image.png

    Otsu’s 二值化是如何工作的?

    image.png
    import cv2
    import numpy as np
    img = cv2.imread('noisy2.png',0)
    blur = cv2.GaussianBlur(img,(5,5),0)
    # find normalized_histogram, and its cumulative distribution function
    # 计算归一化直方图
    #CalcHist(image, accumulate=0, mask=NULL)
    hist = cv2.calcHist([blur],[0],None,[256],[0,256])
    hist_norm = hist.ravel()/hist.max()
    Q = hist_norm.cumsum()
    bins = np.arange(256)
    fn_min = np.inf
    thresh = -1
    for i in xrange(1,256):
        p1,p2 = np.hsplit(hist_norm,[i]) # probabilities
        q1,q2 = Q[i],Q[255]-Q[i] # cum sum of classes 
        b1,b2 = np.hsplit(bins,[i]) # weights
        # finding means and variances
        m1,m2 = np.sum(p1*b1)/q1, np.sum(p2*b2)/q2
        v1,v2 = np.sum(((b1-m1)**2)*p1)/q1,np.sum(((b2-m2)**2)*p2)/q2
        # calculates the minimization function
        fn = v1*q1 + v2*q2
        if fn < fn_min:
            fn_min = fn
            thresh = i
    # find otsu's threshold value with OpenCV function
    ret, otsu = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
    print thresh,ret
    

    相关文章

      网友评论

          本文标题:[OpenCV官方教程中文版-段力辉译]-图像的二值化-cv2.

          本文链接:https://www.haomeiwen.com/subject/caekyltx.html