图像用范识别技术是人工智能的重要领域。它是指图像的对象识别技术,用于识别不同模式的目标和对象。本文从图像识别的技术原理、识别过程以及应围方面讲述对图片识别技术的整体认知。
目录
前言
1.图像识别技术原理
2.图像识别技术流程
3.图像识别技术的应用范围
前言
图像识别的发展经历了三个阶段:
- 字符识别
- 数字图像处理和识别
- 对象识别
顾名思义,图像识别就是对图像进行各种处理,分析,并最终确定我们要研究的目标。当今的图像识别不仅指人的肉眼,而且还指使用计算机技术进行识别。
1.图像识别技术原理
原则上,计算机图像识别技术与人类自身对图像识别之间没有本质区别。我们自身进行图像识别依赖于图像自身特征的分类,然后通过每个类别的特征来识别图像。当我们看到图片时,我们的大脑会很快感觉到它是。你看过这张或类似的图片吗?
在此过程中,我们的大脑根据已在记忆中(图片模型库)分类的类别来识别记忆,检查是否存在与图像具有相同或相似特征的记忆,然后识别我们是否看到了图像。
图像识别技术可以基于图像的主要特征。每个图像都有其自己的特征,例如字母A具有一个尖点,P具有一个圆形,Y的中心具有一个锐角。对图像识别中眼睛运动的研究表明,视线始终集中在图像的主要特征上,即图像轮廓的曲率最大或轮廓方向突然改变的地方,这些地方信息量最大。眼睛的扫描路线总是从一个特征依次转换到另一个特征。因此,在图像识别过程中,感知机制必须排除输入的冗余信息并提取关键信息。同时,必须有一种负责将信息整合到大脑中的机制,
模式识别是人工智能和信息科学的重要组成部分。模式识别是指分析和处理代表事物或现象的不同形式的信息以获得事物,现象的描述,识别和分类的过程。
图像识别技术基于图像的主要特征。每个图像都有自己的特征。对图像识别中的眼睛运动的研究表明,视线始终集中在图像的主要特征上,即图像轮廓的曲率最大或轮廓方向突然改变的地方。这些地方信息量最大。眼睛的扫描路线总是从一个特征依次转换到另一个特征。比如你见到美女,总是先看到那几个固定部位~
因此,在图像识别过程中,感知机制必须排除输入的冗余信息并提取关键信息。同时,必须有一种负责将信息整合到大脑中的机制,该机制可以将分阶段获得的信息组织成完整的感知图像。
2.图像识别技术流程
由于计算机图像识别技术和人体图像识别原理相同,因此它们的过程也非常相似。图像识别技术的过程分为以下几个步骤:
- 信息获取
- 预处理
- 特征提取与选择
- 分类器设计
- 分类决策
信息获取是指通过传感器将光或声音信息转换为电信息。即获取学习对象的基本信息,并将其转换为机器可以通过某种方式识别的信息。
预处理主要为了增强图像的重要特征,为后续识别工作奠定基础,一般包括以下处理方式
- 彩色图像处理-处理颜色
- 图像增强-图像质量得到改善,隐藏细节得以提取
- 图像恢复-清除图像上的模糊和其他垃圾
- 表示和描述-过程数据可视化
- 图像采集-图像被捕获并转换
- 图像压缩和解压缩-必要时更改图像的大小和分辨率
- 形态处理-描述图像对象的结构
- 图像识别-识别图像对象的特定特征
另外,还有使用AI进行图像处理的方法
当前,只有两种:模拟和数字。模拟方法用于处理图像的硬拷贝(如打印输出)。数字设备的任务是使用计算机算法来处理数字图像。
图像恢复被认为是图像处理的重要阶段。以下是一些相关技术:
- 像素化-将打印的图片转换为数字化的图片
- 线性滤波-处理输入信号并产生受线性约束的输出信号
- 边缘检测-查找图像对象的有意义边缘
- 各向异性扩散-在不去除图像关键部分的情况下降低图像噪声
- 主成分分析-提取图像特征
特征提取和选择是指在模式识别中需要特征提取和选择。简单理解就是我们研究的图像是多种多样的。如果要使用某种方法来区分它们,则必须通过它们自己的特征来识别它们。提取这些特征的过程就是特征提取。
在特征提取中获得的特征可能不适用于此识别。这时,我们需要提取有用的特征,即特征选择。特征提取与选择是图像识别过程中的关键技术之一,因此了解这一步骤是图像识别的重点。
分类器
- 分类器将所有训练数据并将其存储起来,以便于未来测试数据用于比较。这在存储空间上是低效的,数据集的大小很容易就以GB计
- 对一个测试图像进行分类需要和所有训练图像作比较,算法计算资源耗费高。
比如线性分类器,就是定义一个评分函数,这个函数将图像的像素值映射为各个分类类别的得分,得分高低代表图像属于该类别的可能性高低。有几点需要注意:
- 一个单独的矩阵乘法W*Xi就高效地并行评估10个不同的分类器(每个分类器针对一个分类),其中每个类的分类器就是W的一个行向量。
- 输入数据(Xi,Yi)是不可变的,但W和b是可控改变的,我们的目标就是通过设置这些参数,使得计算出来的分类分值情况和训练集中图像数据的真实类别标签相符。
- 该方法的一个优势是训练数据是用来学习到参数W和b的,一旦训练完成,训练数据就可以丢弃,留下学习到的参数即可。这是因为一个测试图像可以简单地输入函数,并基于计算出的分类分值来进行分类。
- 最后,注意只需要做一个矩阵乘法和一个矩阵加法就能对一个测试数据分类,这比k-NN中将测试图像和所有训练数据做比较的方法快多了。
3.图像识别技术的应用范围
图像识别包括生物识别,物体和场景识别以及视频识别。生物特征识别包括指纹,手掌,眼睛(视网膜和虹膜),面部等。对象和场景识别包括签名,语音,步行步态,键盘笔触等。
图像识别是一个综合性问题,涉及图像匹配,图像分类,图像检索,人脸检测,行人检测等技术。在互联网搜索引擎,自动驾驶,医学分析,人脸识别,遥感分析等领域具有广泛的应用价值。