美文网首页CV
图像二值化与otsu算法介绍

图像二值化与otsu算法介绍

作者: MarkOut | 来源:发表于2018-03-08 16:29 被阅读0次

图像的二值化,就是讲图像变成黑或者白两种颜色。在很多场合,对图像进行二值化,可以忽略图像的颜色信息,背景信息,保留更加重要的形态信息。并且图像二值化处理之后,图像的信息量大为减少,处理起来也更加方便。

最简单的图像二值化的方法。就是先将图像转化为灰度图,然后再设置一个阈值。小于这个阈值的像素点调整成0,而大于这个阈值的像素点调整成255。

在Python3下,用PIL做图像处理,代码如下:

from PIL import Image

def binarizing(image, threshold=200):
    pixdata = image.load()
    w, h = image.size
    for y in range(h):
        for x in range(w):
            if pixdata[x, y] < threshold:
                pixdata[x, y] = 0
            else:
                pixdata[x, y] = 255
    return image

当然,使用的时候,图像首先要转成灰度图

im = Image.open('1.png').convert('L')

这里的默认阈值是200。这样对处理已经基本是黑白的情况(例如黑白的电子书)效果比较好。但是如果要处理自带底色的(例如火车票)等,直接使用默认阈值就可能使得整张图几乎变成黑色或者白色。例如下图,图一的阈值取在160左右效果比较好,而如果取200,则图像会变成纯黑色。如果我们要处理更多种类的情况,默认阈值法根本不适用。

不同图的灰度直方图

我们看到,文字图片和背景通常会出现两个驼峰。因此,我们需要有一个算法找到这两个驼峰中间的最佳的阈值。otsu法(最大类间方差法,有时也称之为大津算法)就是目前比较好的确定阈值的算法。

otsu算法的原理非常简单。首先,我们把图像分成大于阈值和小于阈值的两个部分,也就是前景与背景两个部分。我们可以计算这两个部分的类间方差。类间方差越大,就说明两个部分直接的灰度差距越大。将0~255这256个阈值都试用一遍,找到类间方差最大的值,通常就是我们要找的最佳阈值了。

代码如下:

import numpy as np

def otsu_threshold(im):
    width, height = im.size
    pixel_counts = np.zeros(256)
    for x in range(width):
        for y in range(height):
            pixel = im.getpixel((x, y))
            pixel_counts[pixel] = pixel_counts[pixel] + 1
    # 得到图片的以0-255索引的像素值个数列表
    s_max = (0, -10)
    for threshold in range(256):
        # 遍历所有阈值,根据公式挑选出最好的
        # 更新
        w_0 = sum(pixel_counts[:threshold])  # 得到阈值以下像素个数
        w_1 = sum(pixel_counts[threshold:])  # 得到阈值以上像素个数
        
        # 得到阈值下所有像素的平均灰度
        u_0 = sum([i * pixel_counts[i] for i in range(0, threshold)]) / w_0 if w_0 > 0 else 0
        
        # 得到阈值上所有像素的平均灰度
        u_1 = sum([i * pixel_counts[i] for i in range(threshold, 256)]) / w_1 if w_1 > 0 else 0
        
        # 总平均灰度
        u = w_0 * u_0 + w_1 * u_1

        # 类间方差
        g = w_0 * (u_0 - u) * (u_0 - u) + w_1 * (u_1 - u) * (u_1 - u)

        # 类间方差等价公式
        # g = w_0 * w_1 * (u_0 * u_1) * (u_0 * u_1)

        # 取最大的
        if g > s_max[1]:
            s_max = (threshold, g)
    return s_max[0]

效果还是不错的。(把个人信息删去了)

火车票二值化

相关文章

  • 图像二值化与otsu算法介绍

    图像的二值化,就是讲图像变成黑或者白两种颜色。在很多场合,对图像进行二值化,可以忽略图像的颜色信息,背景信息,保留...

  • 1.10 openCV-python 图像阈值

    图像阈值 简单阈值,自适应阈值,Otsu’s 二值化等

  • 阈值化

    OpenCV-图像阈值-简单阈值、自适应阈值、Otsu’s 二值化

  • otsu算法

    在计算机视觉和图像处理中,otsu (大津二值化法)用来自动对基于聚类的图像进行二值化,或者说,将一个灰度图退化为...

  • Density Based Fuzzy Thresholding

    前言 之前处理图像二值化时使用的是经典的Otsu算法,这次要求使用Fuzzy Density Model去做一个图...

  • 二值图像分析之轮廓分析

    图像的二值化 在先前的文章二值图像分析:案例实战(文本分离+硬币计数)中已经介绍过,什么是图像的二值化以及二值化的...

  • 2019-05-23 OpenCV学习

    16图像二值化 17超大图像二值化 将超大图像,分块,用局部二值化,或者将图片resize后进行二值化。 或者使用...

  • 图像插值算法和OpenCV框架

    1 算法理论介绍与推荐 1.1 最近邻插值算法原理 最近邻插值,是指将目标图像中的点,对应到源图像中后,找到最相...

  • 图像处理中的算法实现

    在图像处理算法中了解了图像处理算法的一些理论知识,包括图像直方图和图像二值化,本篇文章将会结合上篇文章的理论知识,...

  • 大津算法(OTSU)

    大津算法(OTSU)在图像处理领域,我们会遇到如下需求:把图像中的目标物体和背景分开。比如背景用白色表示,目标物体...

网友评论

    本文标题:图像二值化与otsu算法介绍

    本文链接:https://www.haomeiwen.com/subject/zgsyfftx.html