番外篇: Otsu阈值法

大部分图像处理任务都需要先进行二值化操作，阈值的选取很关键，Otsu阈值法会自动计算阈值。

Otsu阈值法（日本人大津展之提出的，也可称大津算法）非常适用于双峰图片，啥意思呢？

Otsu N. A threshold selection method from gray-level histograms[J]. IEEE transactions on systems, man, and cybernetics, 1979, 9(1): 62-66.

什么是双峰图片？

双峰图片就是指图片的灰度直方图上有两个峰值，直方图就是每个值（0~255）的像素点个数统计，后面会详细介绍。

Otsu算法假设这副图片由前景色和背景色组成，通过统计学方法（最大类间方差）选取一个阈值，将前景和背景尽可能分开，我们先来看下代码，然后详细说明下算法原理。

代码示例

下面这段代码对比了使用固定阈值和Otsu阈值后的不同结果：

另外，对含噪点的图像，先进行滤波操作效果会更好。

代码语言：javascript复制

import cv2
from matplotlib import pyplot as plt

img = cv2.imread('noisy.jpg', 0)

# 固定阈值法
ret1, th1 = cv2.threshold(img, 100, 255, cv2.THRESH_BINARY)

# Otsu阈值法
ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY   cv2.THRESH_OTSU)

# 先进行高斯滤波，再使用Otsu阈值法
blur = cv2.GaussianBlur(img, (5, 5), 0)
ret3, th3 = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY   cv2.THRESH_OTSU)Copy to clipboardErrorCopied

下面我们用Matplotlib把原图、直方图和阈值图都显示出来：

代码语言：javascript复制

images = [img, 0, th1, img, 0, th2, blur, 0, th3]
titles = ['Original', 'Histogram', 'Global(v=100)',
          'Original', 'Histogram', "Otsu's",
          'Gaussian filtered Image', 'Histogram', "Otsu's"]

for i in range(3):
    # 绘制原图
    plt.subplot(3, 3, i * 3   1)
    plt.imshow(images[i * 3], 'gray')
    plt.title(titles[i * 3], fontsize=8)
    plt.xticks([]), plt.yticks([])

    # 绘制直方图plt.hist，ravel函数将数组降成一维
    plt.subplot(3, 3, i * 3   2)
    plt.hist(images[i * 3].ravel(), 256)
    plt.title(titles[i * 3   1], fontsize=8)
    plt.xticks([]), plt.yticks([])

    # 绘制阈值图
    plt.subplot(3, 3, i * 3   3)
    plt.imshow(images[i * 3   2], 'gray')
    plt.title(titles[i * 3   2], fontsize=8)
    plt.xticks([]), plt.yticks([])
plt.show()Copy to clipboardErrorCopied

可以看到，Otsu阈值明显优于固定阈值，省去了不断尝试阈值判断效果好坏的过程。其中，绘制直方图时，使用了numpy中的ravel()函数，它会将原矩阵压缩成一维数组，便于画直方图。

Otsu算法详解

Otsu阈值法将整幅图分为前景（目标）和背景，以下是一些符号规定：

TT：分割阈值
N_0N_0：前景像素点数
N_1N_1：背景像素点数
omega_0ω_0：前景的像素点数占整幅图像的比例
omega_1ω_1：背景的像素点数占整幅图像的比例
mu_0μ_0：前景的平均像素值
mu_1μ_1：背景的平均像素值
muμ：整幅图的平均像素值
rowstimes colsrows×cols：图像的行数和列数

结合下图会更容易理解一些，有一副大小为4×4的图片，假设阈值T为1，那么：

其实很好理解，N_0 N_1N_0 N_1就是总的像素点个数，也就是行数乘列数：

N_0 N_1=rowstimes colsN0 N1=rows×cols

omega_0ω_0和omega_1ω_1是前/背景所占的比例，也就是：

omega_0=frac{N_0}{rowstimes cols}ω0=rows×colsN0omega_1=frac{N_1}{rowstimes cols}ω1=rows×colsN1omega_0 omega_1=1 tag{1}ω0 ω1=1(1)

整幅图的平均像素值就是：

mu=omega_0times mu_0 omega_1times mu_1 tag{2}μ=ω0×μ0 ω1×μ1(2)

此时，我们定义一个前景mu_0μ_0与背景mu_1μ_1的方差gg：

g=omega_0(mu_0-mu)^2 omega_1(mu_1-mu)^2 tag{3}g=ω0(μ0−μ)2 ω1(μ1−μ)2(3)

将前述的1/2/3公式整合在一起，便是：

g=omega_0omega_1(mu_0-mu_1)^2g=ω0ω1(μ0−μ1)2

gg就是前景与背景两类之间的方差，这个值越大，说明前景和背景的差别也就越大，效果越好。Otsu算法便是遍历阈值T，使得gg最大，所以又称为最大类间方差法。基本上双峰图片的阈值T在两峰之间的谷底。

接口文档

cv2.ThresholdTypes
cv2.GaussianBlur()

引用

本节源码
numpy.ravel
Otsu's Method(wikipedia)
Image Thresholding
一维OTSU法、最小交叉熵法、二维OTSU法及C 源码
Otsu N. A threshold selection method from gray-level histograms[J]. IEEE transactions on systems, man, and cybernetics, 1979, 9(1): 62-66.

opencv

0 人点赞