人工智能:计算机视觉系统知识梳理

2023-11-23 17:36:40 浏览数 (1)

1、计算机视觉系统的概念介绍

计算机视觉系统相当于给计算安装上相机和算法,使得计算机可以感知环境的能力,从而实现目标识别、跟踪、测量等,并进一步进行图像处理。让其转化为更适合人们观察或者仪器检测的图像,最终为人们的日常生活提供帮助!

2、计算机视觉技术处理图像的流程

● 图像预处理:用来消除图像中的无关信息,并恢复有用的真实信息,增强有关图像信息的可检测性,尽可能的简化数据,为后续的特征提取、图像分割、图像识别提供可靠的支撑。

● 特征设计与提取:使用计算机提取图像信息,决定每个图像点是否属于同一个图像特征,最终的结果是把图像上的点分为不同的子集。特征提取的好坏对泛化性能有非常重要的影响。

● 特征汇聚或变换:对前一阶段提取的局部信息特征进行统计汇聚或者降维处理,然后降低维度对后续的分类或回归处理变得更加方便。

● 分类器/回归器的设计与训练:采用模式识别或机器学习方法(向量机、决策树、人工神经网络算法)训练出合理的模型。

3、计算机视觉涉及的关键技术

计算机视觉涉及的关键技术主要有图像分类、目标定位与跟踪、目标检测、图像语义分割。下面给大家逐一介绍。

3.1 图像分类

● 图像分类主要基于图像的内容对图像进行标记,然后根据计算机视觉模型预测出最合适的图像标签。图像分类属于计算机视觉技术重要的基础问题,也是活体检测、图像分割、行为分析、人脸识别的等高层视觉任务的基础。

● 图像分类的场景:交通领域的交通场景识别、医学领域的图像识别等等。

● 图像识别的难点:视点变化、图像变形、图像遮挡、照明条件等等。

● 训练图像分类任务常用的模型:AlexNet、VGG、GooLeNet、ResNet、Inception-v4、DPN、ShuffleNet等。

3.2 目标定位与跟踪

● 目标定位:主要是了解图像中的目标具体在图像的什么位置,目标定位通常以包围盒的形式返回。

● 目标跟踪:主要是在给定的场景中跟踪感兴趣的对象。目前最典型的案例就是无人驾驶。

3.3 目标检测

目标检测指的是用算法判断图片中是否包含特定的目标,并且在图像中标记特定目标的位置(红框把目标圈起来)。目标检测侧重于对特定目标的检索,一般情况下目标检测的目标必须有固定的形状和轮廓。

目标检测常用的模型:SSD模型、PyramidBox模型、R-CNN模型

3.4 图像语义分割

● 目的:将图像像素按照表达的语义含义的不同之处进行分组/分割。

● 图像语义:主要是对图像内容的理解(能够描述出图像中什么物体在哪里做了什么事情等等)。

● 图像分割:对图片中的每个像素点进行标注,标注其属于哪一类别。

● 分割任务:分为实例分割、语义分割,实例分割:是物体检测加语义分割的综合体。图像语义分割常用模型:R-CNN、ICNet、DeepLabv 。

● 使用场景:无人驾驶技术当中分割街景,从而达到规避行人车辆的问题、目前最火的美颜功能。

0 人点赞