美文网首页
Python opencv操作图像

Python opencv操作图像

作者: dawsonenjoy | 来源:发表于2019-09-28 22:31 被阅读0次

    安装

    pip install opencv-python
    # 基于numpy
    

    导入模块

    import cv2
    

    实际上所有图像都可以被看作一个个矩阵数组(数据类型为:np.uint8,别问我为什么...我就直接跟你说了吧...图片的像素在0~255,和uint8范围刚好一样,所以才需要设置这个数据类型,以保证数据都是合理的...详细可以看下面的踩坑记录),里面存放着一堆分布在0~255的像素点,而opencv就是将这些像素点的色调显示出来,从而形成一个图像

    常用操作

    读取图像
    • 基于文件名读取:
      imread,第一个参数为图像路径,第二个参数可选,意思是通过几个通道数读取图像,1个通道数则是黑白图片,3个则是基于RGB色调的彩色图片,举例:
    import numpy as np
    import cv2
    img = np.array()
    # 图像本质就是一个矩阵
    cv2.imread(img, 1)
    # 以黑白方式读取图片
    
    # 展示图片
    from matplotlib import pyplot as plt
    plt.imshow(img, cmap='gray')
    # img是一个图像矩阵,cmap为显示类型,这里通过灰阶显示
    plt.show()
    
    • 基于二进制流读取:
      使用cv2.imdecode(np.frombuffer(img, np.uint8), cv2.IMREAD_COLOR)读取
    修改形状

    resize,举例:

    >>> img = cv2.imread("1.jpg")
    >>> img.shape
    (661, 659, 3)
    >>> cv2.resize(img, (80, 120)).shape
    # 将图片转成120*80的图片,注意这里宽高是反过来的
    (120, 80, 3)
    >>> cv2.resize(img, (-1, -1), fx=0.5, fy=0.2).shape
    # 将图片宽高缩放成0.5和0.2
    (132, 330, 3)
    

    更多参考:https://blog.csdn.net/li_l_il/article/details/83218838

    显示图像

    imshow,但是会打开一个新的程序窗口查看图像,不太适合用在像jupyter notebook这样的环境,因此更推荐使用matplotlib.pyplot下的imshowshow方法,举例:

    import cv2
    cv2.imshow("image",img)
    # 打开图像窗口
    cv2.waitKey(0)
    # 按下0键前一直显示
    cv2.destroyAllWindows()
    # 关闭图像窗口
    # 不太推荐使用,推荐下面的那种
    
    from matplotlib import pyplot as plt
    plt.imshow(img, cmap='gray')
    # img是一个图像矩阵,cmap为显示类型,这里通过灰阶显示
    plt.show()
    
    保存图像

    imwrite,举例:

    >>> img = cv2.imread("1.jpg")
    >>> cv2.imwrite("test.jpg", img)
    # 保存图像,第一个参数是保存的路径,第二个是图像的数组
    True
    

    这里有一个坑:由于jpg是有损压缩,而png是无损压缩,所以在保存时如果希望保持像素值完全不变的话,一定要保存成png格式,举例:

    >>> x = cv2.imread("1.jpg")
    # 读取图片
    >>> cv2.imwrite("2.jpg", x)
    # 保存一份jpg格式
    True
    >>> cv2.imwrite("2.png", x)
    # 保存一份png格式
    True
    >>> y = cv2.imread("2.jpg")
    # 读取保存后的jpg格式
    >>> z = cv2.imread("2.png")
    # 读取保存后的png格式
    >>> np.all(x == y)
    # 可以看出保存的jpg和原图是不同的
    False
    >>> np.all(x == z)
    # 保存的png和原图是相同的
    True
    
    base64/二进制/矩阵格式转换

    参考:
    https://blog.csdn.net/cnmnui/article/details/105831908
    https://blog.csdn.net/qian1122221/article/details/84567715

    画图
    矩形

    rectangle,依次传入图片数组、左上角坐标、右下角坐标、颜色元组和线的粗细程度,举例:

    import cv2
    img = cv2.imread("1.jpg")
    cv2.rectangle(img, (10, 10), (200, 200), (0, 255, 0), 1)
    # 画一个框,左上角坐标为(10, 10),右下角坐标为(200, 200),颜色为绿色,线的粗细为1
    cv2.imshow("image",img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    直线

    line,使用方法和矩形一样,传入的两个坐标分别为头和尾坐标

    circle,依次传入图片数组、圆心坐标、半径、颜色元组和线的粗细程度,举例:

    import cv2
    img = cv2.imread("1.jpg")
    cv2.circle(img, (200, 200), 30, (0, 255, 0),  10)
    cv2.imshow("image",img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    多边形

    polylines,依次传入图片数组、每个角的坐标(需要传入一个列表,列表里面是numpy数组)、是否封闭、颜色元组和线的粗细程度,举例:

    import cv2
    import numpy as np
    img = cv2.imread("1.jpg")
    cv2.polylines(img,[np.array([[100,100],[200,100],[100,200]])],True,(0,255,255),2)
    cv2.imshow("image",img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    文字

    putText,依次传入图片数组、文本内容、坐标、字体、尺寸大小、颜色元组和线的粗细程度,举例:

    import cv2
    img = cv2.imread("1.jpg")
    cv2.putText(img, "hello", (500, 200), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 0),  1)
    cv2.imshow("image",img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    教程参考

    https://www.kancloud.cn/aollo/aolloopencv/269602

    图像模糊判断

    可以通过内置的拉普拉斯算法进行计算,一般情况下计算出的值越小,代表清晰度越低,代码很简单,举例:

    >>> img = cv2.imread('xxx.png')
    >>> cv2.Laplacian(img, cv2.CV_64F).var()
    1787.805508284248
    

    使用拉普拉斯算法注意参考:https://www.jianshu.com/p/60ac53013be4

    其他参考

    opencv下还提供了如人脸识别功能等,可以参考别的博客,如:
    https://blog.csdn.net/luanpeng825485697/article/details/79509870
    https://www.cnblogs.com/hanson1/p/7105265.html
    https://www.cnblogs.com/traditional/p/9043931.html

    踩坑记录

    中文问题

    使用cv2的时候一定要注意:读取的文件路径一定不能含有中文,日文等,包括打算给图片加上中文等字符,都会失败,如果一定要使用中文的话,建议使用PIL模块

    数组无法用opencv操作

    理论上来说,图像都是一堆数组,所以我们生成一个相同尺寸的数组,应该也能够被默认当做图像来操作才对,于是我偶然试试生成一个随机数组,想对其进行resize操作,发现竟然报错了?就像下面这样:

    import numpy as np
    import cv2
    
    img = np.random.randint(0, 255, (100, 100))
    cv2.resize(img, (120, 80))
    
    # 报错:
    # error: OpenCV(4.1.0) C:\projects\opencv-python\opencv\modules\imgproc\src\resize.cpp:3596: error: (-215:Assertion failed) func != 0 in function 'cv::hal::resize'
    

    ???啥玩意儿,明明我的数都在0~255之间,却还是不行,后来读了个图像,发现了区别:

    import numpy as np
    import cv2
    
    img = np.random.randint(0, 255, (100, 100))
    # 随机生成的图片
    img1 = cv2.imread("xxx.jpg", 0)
    # 用单通道读取图片,显示内容少点好对比
    img, img1
    
    # 结果:
    # (array([[ 30,  31, 151, ..., 212, 205,  81],
    #         [110, 202, 127, ..., 239,  72, 171],
    #         [109, 228,  87, ..., 231,  65, 250],
    #         ...,
    #         [ 22,  66,   4, ..., 104, 198,  67],
    #         [163, 121, 109, ..., 247, 129, 157],
    #         [141, 133,  50, ...,  44,  50, 124]]),
    #  array([[ 80,  80,  80, ...,  73,  75,  74],
    #         [ 81,  81,  81, ...,  73,  75,  75],
    #         [ 82,  82,  82, ...,  73,  75,  76],
    #         ...,
    #         [133, 151, 158, ..., 127, 114, 116],
    #         [147, 127, 126, ..., 119, 113,  92],
    #         [136, 122, 118, ..., 127, 107,  96]], dtype=uint8))
    

    可以发现最后一行有个微妙的差别...那就是需要设置数据类型,因此将随机生成的数组的数据类型转成uint8就行了,就像下面这样:

    import numpy as np
    import cv2
    
    img = np.random.randint(0, 255, (100, 100)).astype(np.uint8)
    img1 = cv2.resize(img, (120, 80))
    img1.shape
    # (80, 120),可以看出裁剪成功
    

    相关文章

      网友评论

          本文标题:Python opencv操作图像

          本文链接:https://www.haomeiwen.com/subject/xaidzftx.html