一文带你读懂图像处理工作原理

2018-12-18 10:00:24 浏览数 (1)

本文为 AI 研习社编译的技术博客,原标题 : An Amazing Insight of How Image Processing Works 作者 | Bhanu Parashar 翻译 | 老赵 校对 | 酱番梨 整理 | 菠萝妹 原文链接: https://medium.com/@bhanuparashar23/an-amazing-insight-of-how-image-processing-works-9b7a17aa42a4

对图像处理如何工作的理解

我发现的最令人惊奇的是如何使用微积分巧妙地计算图像边缘。

考虑一个黑白图像

在这里,我放大了一个小区域。

如你所见,它包含许多像素。

它可以表示为具有以下约束的2D矩阵:

  1. 在AijAij中,i表示像素的x坐标,j表示y坐标
  2. 左上角是坐标(0,0)
  3. x,即向右移动时增加,而y,j在向下移动时增加
  4. AijAij的值范围为0到255,0表示黑色255表示白色

所以这个小区域的矩阵将是

现在只考虑矩阵的一行。

即:像这样的东西

表示为:

如果我们在图表上绘制它:

它会像

记住高值意味着更多的白色,低值意味着更多的黑色,范围从0到255。

第1部分:现在有趣的开始

如果我们将这个图表区分开来,考虑到函数y = f(x),该怎么办?

这里y是值AijAij,x是矩阵的i(这里y是不同的)

那么让我们绘制它的衍生物

正如你可以看到,从白色到黑色的图像变化点,衍生物的值突然增加

如果我们进一步区分,即双重差异,该怎么办?

所以你可以看到变化区域的突然爆发。

让我们在图像行中标记点:

现在,如果我们将这个东西应用于所有行并标记双重导数的高值。

它沿着图像的边缘

同样也可以将它用于所有列,你将获得图像中的完整边缘。

第2部分:数学实施(比上面更令人惊讶)

如何通过计算机将这种差异应用于图像:

一些数学家发现了一种叫做卷积的现象让我先解释一下:

考虑一个大的NxN矩阵和一个小的3x3矩阵:

这里,如果小矩阵的点积与大矩阵的所有3x3大小的部分完成。 点积表示每个元素乘以其各自的元素,例如。 131 *( - 1),162 * 0,232 * 1等。

结果保存在另一个矩阵中。

这个过程称为卷积,这里3x3矩阵是内核,它可以更大,但最常用的是3x3。

这种现象是,如果一个大矩阵与一个类似于核的核心区域进行卷积,则在结果矩阵中突出显示(值增加),而非相似区域变暗。

代表双重差异的内核是:

以上这些也称为Sobel Kernel

第3部分:基于C 的OpenCV实现

输出

通过使用高斯导数,Canny边缘检测去除噪声可以实现许多进步,这些可以在线轻松研究。

图像:除了提供链接的图像之外的所有图像都是由我捕获和编辑的。

它如何扩展到彩色图像

颜色通常表示为RGB值(这里是OpenCV,它是BGR)

B->蓝色,G->绿色,R->红色边缘检测通常在将彩色图像转换为黑白之后进行。

但是还有一种方法,Image可以转换为HSV色空间这里 H 代表 Hue,S 代表饱和度,V 代表值,即 H 代表颜色,S 代表强度,V 代表亮度。

因此,如果我们只采用H或Hue,我们可以找到边缘而不受阴影或光线的影响。

还有其他方法。

0 人点赞