美文网首页ndk
OpenCV+Python识别车牌和字符分割

OpenCV+Python识别车牌和字符分割

作者: 一杯茶一本书 | 来源:发表于2019-01-30 22:26 被阅读71次

    前面已经基于MNIST识别手写字体(基于MNIST数据集实现手写数字识别),接着本篇文章主要基于python语言和OpenCV库(cv2)进行车牌区域识别和字符分割,后续将结合这些基于tensorflow识别分割的字符。针对在python中安装opencv的环境这里不做介绍,可以自行安装配置!

    车牌号检测需要大致分为四个部分:

    • 1.车辆图像获取

    • 2.车牌定位、

    • 3.车牌字符分割

    • 4.车牌字符识别

    具体介绍

    车牌定位需要用到的是图片二值化为黑白后进canny边缘检测后多次进行开运算与闭运算用于消除小块的区域,保留大块的区域,后用cv2.rectangle选取矩形框,从而定位车牌位置

    车牌字符的分割前需要准备的是只保留车牌部分,将其他部分均变为黑色背景。这里我采用cv2.grabCut方法,可将图像分割成前景与背景。分割完成后,再经过二值化为黑白图后即可进行字符分割。由于图像中只有黑色和白色像素,因此我们需要通过图像的白色像素和黑色像素来分割开字符。即分别通过判断每一行每一列的黑色白色像素值的位置,来定位出字符。

    具体步骤如下:

    • 1.灰度转换:将彩色图片转换为灰度图像,常见的R=G=B=像素平均值。

    • 2.高斯平滑和中值滤波:去除噪声。

    • 3.Sobel算子:提取图像边缘轮廓,X方向和Y方向平方和开跟。

    • 4.二值化处理:图像转换为黑白两色,通常像素大于127设置为255,小于设置为0。

    • 5.膨胀和细化:放大图像轮廓,转换为一个个区域,这些区域内包含车牌。

    • 6.通过算法选择合适的车牌位置,通常将较小的区域过滤掉或寻找蓝色底的区域。

    • 7.标注车牌位置

    • 8.图像切割和识别

    通过代码实现:

    # -*- coding: utf-8 -*-
    """
    @email:cuiran2001@163.com
    @author: cuiran
    """
    import cv2
    import numpy as np
    from PIL import Image
    import os.path
    from skimage import io,data
    def stretch(img):
        '''
        图像拉伸函数
        '''
        maxi=float(img.max())
        mini=float(img.min())
    
        for i in range(img.shape[0]):
            for j in range(img.shape[1]):
                img[i,j]=(255/(maxi-mini)*img[i,j]-(255*mini)/(maxi-mini))
    
        return img
    
    def dobinaryzation(img):
        '''
        二值化处理函数
        '''
        maxi=float(img.max())
        mini=float(img.min())
    
        x=maxi-((maxi-mini)/2)
        #二值化,返回阈值ret  和  二值化操作后的图像thresh
        ret,thresh=cv2.threshold(img,x,255,cv2.THRESH_BINARY)
        #返回二值化后的黑白图像
        return thresh
    
    def find_rectangle(contour):
        '''
        寻找矩形轮廓
        '''
        y,x=[],[]
    
        for p in contour:
            y.append(p[0][0])
            x.append(p[0][1])
    
        return [min(y),min(x),max(y),max(x)]
    
    def locate_license(img,afterimg):
        '''
        定位车牌号
        '''
        img,contours,hierarchy=cv2.findContours(img,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
    
        #找出最大的三个区域
        block=[]
        for c in contours:
            #找出轮廓的左上点和右下点,由此计算它的面积和长度比
            r=find_rectangle(c)
            a=(r[2]-r[0])*(r[3]-r[1])   #面积
            s=(r[2]-r[0])*(r[3]-r[1])   #长度比
    
            block.append([r,a,s])
        #选出面积最大的3个区域
        block=sorted(block,key=lambda b: b[1])[-3:]
    
        #使用颜色识别判断找出最像车牌的区域
        maxweight,maxindex=0,-1
        for i in range(len(block)):
            b=afterimg[block[i][0][1]:block[i][0][3],block[i][0][0]:block[i][0][2]]
            #BGR转HSV
            hsv=cv2.cvtColor(b,cv2.COLOR_BGR2HSV)
            #蓝色车牌的范围
            lower=np.array([100,50,50])
            upper=np.array([140,255,255])
            #根据阈值构建掩膜
            mask=cv2.inRange(hsv,lower,upper)
            #统计权值
            w1=0
            for m in mask:
                w1+=m/255
    
            w2=0
            for n in w1:
                w2+=n
    
            #选出最大权值的区域
            if w2>maxweight:
                maxindex=i
                maxweight=w2
    
        return block[maxindex][0]
    
    def find_license(img):
        '''
        预处理函数
        '''
        m=400*img.shape[0]/img.shape[1]
    
        #压缩图像
        img=cv2.resize(img,(400,int(m)),interpolation=cv2.INTER_CUBIC)
    
        #BGR转换为灰度图像
        gray_img=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    
        #灰度拉伸
        stretchedimg=stretch(gray_img)
    
        '''进行开运算,用来去除噪声'''
        r=16
        h=w=r*2+1
        kernel=np.zeros((h,w),np.uint8)
        cv2.circle(kernel,(r,r),r,1,-1)
        #开运算
        openingimg=cv2.morphologyEx(stretchedimg,cv2.MORPH_OPEN,kernel)
        #获取差分图,两幅图像做差  cv2.absdiff('图像1','图像2')
        strtimg=cv2.absdiff(stretchedimg,openingimg)
    
        #图像二值化
        binaryimg=dobinaryzation(strtimg)
    
        #canny边缘检测
        canny=cv2.Canny(binaryimg,binaryimg.shape[0],binaryimg.shape[1])
    
        '''消除小的区域,保留大块的区域,从而定位车牌'''
        #进行闭运算
        kernel=np.ones((5,19),np.uint8)
        closingimg=cv2.morphologyEx(canny,cv2.MORPH_CLOSE,kernel)
    
        #进行开运算
        openingimg=cv2.morphologyEx(closingimg,cv2.MORPH_OPEN,kernel)
    
        #再次进行开运算
        kernel=np.ones((11,5),np.uint8)
        openingimg=cv2.morphologyEx(openingimg,cv2.MORPH_OPEN,kernel)
    
        #消除小区域,定位车牌位置
        rect=locate_license(openingimg,img)
    
        return rect,img
    
    def cut_license(afterimg,rect):
        '''
        图像分割函数
        '''
        #转换为宽度和高度
        rect[2]=rect[2]-rect[0]
        rect[3]=rect[3]-rect[1]
        rect_copy=tuple(rect.copy())
        rect=[0,0,0,0]
        #创建掩膜
        mask=np.zeros(afterimg.shape[:2],np.uint8)
        #创建背景模型  大小只能为13*5,行数只能为1,单通道浮点型
        bgdModel=np.zeros((1,65),np.float64)
        #创建前景模型
        fgdModel=np.zeros((1,65),np.float64)
        #分割图像
        cv2.grabCut(afterimg,mask,rect_copy,bgdModel,fgdModel,5,cv2.GC_INIT_WITH_RECT)
        mask2=np.where((mask==2)|(mask==0),0,1).astype('uint8')
        img_show=afterimg*mask2[:,:,np.newaxis]
    
        return img_show
    
    def deal_license(licenseimg):
        '''
        车牌图片二值化
        '''
        #车牌变为灰度图像
        gray_img=cv2.cvtColor(licenseimg,cv2.COLOR_BGR2GRAY)
    
        #均值滤波  去除噪声
        kernel=np.ones((3,3),np.float32)/9
        gray_img=cv2.filter2D(gray_img,-1,kernel)
    
        #二值化处理
        ret,thresh=cv2.threshold(gray_img,120,255,cv2.THRESH_BINARY)
    
        return thresh
    
    
    def find_end(start,arg,black,white,width,black_max,white_max):
        end=start+1
        for m in range(start+1,width-1):
            if (black[m] if arg else white[m])>(0.98*black_max if arg else 0.98*white_max):
                end=m
                break
        return end
    
    
    if __name__=='__main__':
        img=cv2.imread('test_images/car001.jpg',cv2.IMREAD_COLOR)
        #预处理图像
        rect,afterimg=find_license(img)
    
        #框出车牌号
        cv2.rectangle(afterimg,(rect[0],rect[1]),(rect[2],rect[3]),(0,255,0),2)
        cv2.imshow('afterimg',afterimg)
    
        #分割车牌与背景
        cutimg=cut_license(afterimg,rect)
        cv2.imshow('cutimg',cutimg)
    
        #二值化生成黑白图
        thresh=deal_license(cutimg)
        cv2.imshow('thresh',thresh)
        cv2.waitKey(0)
    
        #分割字符
        '''
        判断底色和字色
        '''
        #记录黑白像素总和
        white=[]
        black=[]
        height=thresh.shape[0]  #263
        width=thresh.shape[1]   #400
        #print('height',height)
        #print('width',width)
        white_max=0
        black_max=0
        #计算每一列的黑白像素总和
        for i in range(width):
            line_white=0
            line_black=0
            for j in range(height):
                if thresh[j][i]==255:
                    line_white+=1
                if thresh[j][i]==0:
                    line_black+=1
            white_max=max(white_max,line_white)
            black_max=max(black_max,line_black)
            white.append(line_white)
            black.append(line_black)
            print('white',white)
            print('black',black)
        #arg为true表示黑底白字,False为白底黑字
        arg=True
        if black_max<white_max:
            arg=False
    
        n=1
        start=1
        end=2
        s_width=28
        s_height=28
        while n<width-2:
            n+=1
            #判断是白底黑字还是黑底白字  0.05参数对应上面的0.95 可作调整
            if(white[n] if arg else black[n])>(0.02*white_max if arg else 0.02*black_max):
                start=n
                end=find_end(start,arg,black,white,width,black_max,white_max)
                n=end
                if end-start>5:
                    cj=thresh[1:height,start:end]
    
                    # new_image = cj.resize((s_width,s_height),Image.BILINEAR)
                    # cj=cj.reshape(28, 28)
                    print("result/%s.jpg" % (n))
                    #保存分割的图片 by cayden
                    # cj.save("result/%s.jpg" % (n))
                    infile="result/%s.jpg" % (n)
                    io.imsave(infile,cj)
    
                    # im = Image.open(infile)
                    # out=im.resize((s_width,s_height),Image.BILINEAR)
                    # out.save(infile)
    
                    cv2.imshow('cutlicense',cj)
                    cv2.waitKey(0)
    
    
        cv2.waitKey(0)
        cv2.destroyAllWindows()
    

    运行效果如图所示

    车牌定位并进行处理

    车牌分割如图所示


    后面将实现基于深度学习来识别具体分割的字符,敬请期待!!!

    下面的是我的公众号二维码图片,欢迎扫码关注!

    帝都小崔Cayden公众号

    相关文章

      网友评论

        本文标题:OpenCV+Python识别车牌和字符分割

        本文链接:https://www.haomeiwen.com/subject/hydhsqtx.html