大津法(Python实现)

在计算机视觉和图像处理中,大津法被用于自动获取图像的阈值,或者将灰度图像转换为二值化图像。该算法假设图像包含两个类别的像素(前景像素和背景像素),然后它计算一个最优的阈值用于分离前景和背景,使得前景和背景的类间方差最小。

下面定义类间方差的计算公式:
假设我们使用阈值T将灰度图像分割为前景和背景
size:图像总像素个数
u:图像的平均灰度
w0:前景像素点占整幅图像大小的比例
u0:前景像素点的平均值
w1:背景像素点占整幅图像大小的比例
u0:背景像素点的平均值
g:类间方差

u = w0 * u0 + w1 * u1  (1)
g = w0*(u - u0)^2 + w1*(u - u1)^2 (2)
将(1)代入(2)得:
g = w0 * w1 * (u0 - u1)^2

采用遍历的方法,遍历所有阈值,当g最大时,该阈值就是我们所求的认为最合适的阈值了。
偷偷告诉你,opencv有自带的使用大津法阈值化的方法,如下:
cv2.threshold(img, th1, max_val, cv2.THRESH_OTSU) 
使用参数cv2.THRESH_OTSU后,前面的th1就无效了。

以下是我自己写的Python版函数:
import numpy as np

def OTSU_enhance(img_gray, th_begin=0, th_end=256, th_step=1):
    assert img_gray.ndim == 2, "must input a gary_img"

    max_g = 0
    suitable_th = 0
    for threshold in xrange(th_begin, th_end, th_step):
        bin_img = img_gray > threshold
        bin_img_inv = img_gray <= threshold
        fore_pix = np.sum(bin_img)
        back_pix = np.sum(bin_img_inv)
        if 0 == fore_pix:
            break
        if 0 == back_pix:
            continue

        w0 = float(fore_pix) / img_gray.size
        u0 = float(np.sum(img_gray * bin_img)) / fore_pix
        w1 = float(back_pix) / img_gray.size
        u1 = float(np.sum(img_gray * bin_img_inv)) / back_pix
        # intra-class variance
        g = w0 * w1 * (u0 - u1) * (u0 - u1)
        if g > max_g:
            max_g = g
            suitable_th = threshold
    return suitable_th



郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。