人工智能：计算机视觉系统知识梳理

计算机视觉系统相当于给计算安装上相机和算法，使得计算机可以感知环境的能力，从而实现目标识别、跟踪、测量等，并进一步进行图像处理。让其转化为更适合人们观察或者仪器检测的图像，最终为人们的日常生活提供帮助！

● 图像预处理：用来消除图像中的无关信息，并恢复有用的真实信息，增强有关图像信息的可检测性，尽可能的简化数据，为后续的特征提取、图像分割、图像识别提供可靠的支撑。

● 特征设计与提取：使用计算机提取图像信息，决定每个图像点是否属于同一个图像特征，最终的结果是把图像上的点分为不同的子集。特征提取的好坏对泛化性能有非常重要的影响。

● 特征汇聚或变换：对前一阶段提取的局部信息特征进行统计汇聚或者降维处理，然后降低维度对后续的分类或回归处理变得更加方便。

● 分类器/回归器的设计与训练：采用模式识别或机器学习方法（向量机、决策树、人工神经网络算法）训练出合理的模型。

计算机视觉涉及的关键技术主要有图像分类、目标定位与跟踪、目标检测、图像语义分割。下面给大家逐一介绍。

● 图像分类主要基于图像的内容对图像进行标记，然后根据计算机视觉模型预测出最合适的图像标签。图像分类属于计算机视觉技术重要的基础问题，也是活体检测、图像分割、行为分析、人脸识别的等高层视觉任务的基础。

● 图像分类的场景：交通领域的交通场景识别、医学领域的图像识别等等。

● 图像识别的难点：视点变化、图像变形、图像遮挡、照明条件等等。

● 训练图像分类任务常用的模型：AlexNet、VGG、GooLeNet、ResNet、Inception-v4、DPN、ShuffleNet等。

● 目标定位：主要是了解图像中的目标具体在图像的什么位置，目标定位通常以包围盒的形式返回。

● 目标跟踪：主要是在给定的场景中跟踪感兴趣的对象。目前最典型的案例就是无人驾驶。

目标检测指的是用算法判断图片中是否包含特定的目标，并且在图像中标记特定目标的位置（红框把目标圈起来）。目标检测侧重于对特定目标的检索，一般情况下目标检测的目标必须有固定的形状和轮廓。

目标检测常用的模型：SSD模型、PyramidBox模型、R-CNN模型

● 目的：将图像像素按照表达的语义含义的不同之处进行分组/分割。

● 图像语义：主要是对图像内容的理解（能够描述出图像中什么物体在哪里做了什么事情等等）。

● 图像分割：对图片中的每个像素点进行标注，标注其属于哪一类别。

● 分割任务：分为实例分割、语义分割，实例分割：是物体检测加语义分割的综合体。图像语义分割常用模型：R-CNN、ICNet、DeepLabv 。

● 使用场景：无人驾驶技术当中分割街景，从而达到规避行人车辆的问题、目前最火的美颜功能。

0 人点赞