【计算机视觉处理5】阈值处理

2021-05-18 11:19:33 浏览数 (1)

【计算机视觉处理5】阈值处理

1、阈值处理

阈值处理就是设定某个阈值,然后对大于阈值的像素或者小于阈值的像素统一处理的过程。比如下面这个简单的图像:

每个格子表示一个像素,格子中的数字表示图片的像素值。如果设定阈值为8,那我们可以把图片分成两个区域,如下图:

然后我们统一对绿色区域或者蓝色区域进行操作,这就是阈值处理了。

我们通常的操作是将高于某一阈值的像素值处理为255,或者低于某一阈值的像素值处理为0。或者两者同时进行。当我们两者同时进行时,我们可以把这个操作成为二值化,因为处理后的图片只有纯黑和纯白两个颜色。

2、用numpy实现阈值处理

numpyndarray数组中,提供了布尔索引的操作。通过布尔索引我们可以方便快速实现阈值处理,而不需要写大量的for循环。

布尔索引的操作是基于布尔矩阵的,因此我们需要了解一下布尔矩阵。

(1)布尔矩阵

布尔矩阵其实就是一个元素类型为布尔的矩阵,使用布尔矩阵我们可以对实数矩阵进行布尔索引操作。

我们使用下面代码生成一个布尔矩阵:

代码语言:javascript复制
import numpy as np
m = np.array([False, True, False, False], dtype=np.bool_)
print(m)

输出结果如下:

代码语言:javascript复制
[False  True False False]

不过这个矩阵好像没有什么作用。写出上面的代码只是为了让你知道,布尔矩阵就是一个布尔类型的ndarray数组。

除了自己手动创建布尔矩阵,我们还可以通过比较运算符生成某个数组的布尔矩阵。如:

代码语言:javascript复制
import numpy as np
# 生成一个二维矩阵
x = np.array([
    [10, 13, 90],
    [80, 21, 34],
    [1, 4, 6]], dtype=np.uint8
)
# 通过比较生成布尔矩阵
bool_x = x > 8
print(bool_x)

在代码中,我们创建了一个二维矩阵。然后通过x > 8来生成一个布尔矩阵,下面是输出结果:

代码语言:javascript复制
[[ True  True  True]
 [ True  True  True]
 [False False False]]

可以看到bool_xx的形状是一样的,布尔矩阵和二维矩阵元素之间一一对应。当元素值大于8,在布尔矩阵中表现为True否则表现为False。图示如下:

(2)布尔索引

有了布尔矩阵,我们就可以进行布尔索引了。布尔索引只会对矩阵中为True的部分进行操作。比如下面的代码:

代码语言:javascript复制
import numpy as np
x = np.array([
    [10, 13, 90],
    [80, 21, 34],
    [1, 4, 6]], dtype=np.uint8
)
bool_x = x > 8
# 将元素值大于8的元素赋值为255
x[bool_x] = 255
print(x)

输出结果如下:

代码语言:javascript复制
[[255 255 255]
 [255 255 255]
 [  1   4   6]]

这里需要明确,我们操作的是实数矩阵。布尔矩阵只是用来指引,告诉程序我们需要操作的元素。

从结果可以看到,大于8的元素都被赋值为了255,其它元素没有改变。

3、opencv实现阈值处理

(1)阈值处理函数

opencv中提供了阈值处理的函数,其函数定义为:

代码语言:javascript复制
thresh, dst = cv2.threshold(src, thresh, maxval, type)

参数含义如下:

返回的两个值分别是阈值和处理后的结果图像。

下面是阈处理类型可选的几个参数:

当我们阈值处理类型为二值处理时,maxval参数才起作用。

(3)阈值处理的区别

下面我们来说说各种阈值处理的区别。具体如下表:

我们用代码来实战一下:

代码语言:javascript复制
import cv2
# 读取图片
img = cv2.imread('beautiful.JPG', 0)
# 进行二值化阈值处理
_, result = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# 显示图片
cv2.imshow('result', result)
cv2.waitKey()
cv2.destroyAllWindows()

下面是效果图和原图的对比:

可以看到,原图本事要偏暗。而我们的阈值设置为了127,导致得到的二值图像效果要差一些,这个我们后面会提到解决办法。

我们再来尝试一下截断式阈值处理:

代码语言:javascript复制
import cv2
img = cv2.imread('beautiful.JPG')
_, result = cv2.threshold(img, 100, 255, cv2.THRESH_TRUNC)
cv2.imshow('result', result)
cv2.waitKey()
cv2.destroyAllWindows()

这次我们没有以灰度图的方式读取图片,因此最后的结果也是彩色图片,下面是效果图:

因为一些像素值高的点被抑制了,所以效果图偏暗,而且对比度也明显降低了。

其余的大家可以自己尝试一下。

4、Otsu处理

在上面的例子中,我们都需要手动设置阈值。而且不同图像设置不同的阈值效果上会有很大区别,而Otsu算法就是一种自动确定阈值的算法。我们可以用cv2.threshold函数直接实现,使用如下:

代码语言:javascript复制
import cv2
import numpy as np
img = cv2.imread('beautiful.JPG', 0)
_, result1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# 使用Otsu算法
thresh, result2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY cv2.THRESH_OTSU)
# 将两张图片横向拼接
result = np.hstack((result1, result2))
# 输出Ostu算法得到的阈值
print(thresh)
cv2.imshow('result', result)
cv2.waitKey()
cv2.destroyAllWindows()

我们分别使用了普通的二值化和Otsu算法,下面是效果图:

这次效果上背景看的更加清晰了。

输出的阈值如下:

代码语言:javascript复制
99.0

大家可以多尝试处理一些不同的图片。

0 人点赞