1、计算机视觉系统的概念介绍
计算机视觉系统相当于给计算安装上相机和算法,使得计算机可以感知环境的能力,从而实现目标识别、跟踪、测量等,并进一步进行图像处理。让其转化为更适合人们观察或者仪器检测的图像,最终为人们的日常生活提供帮助!
2、计算机视觉技术处理图像的流程
● 图像预处理:用来消除图像中的无关信息,并恢复有用的真实信息,增强有关图像信息的可检测性,尽可能的简化数据,为后续的特征提取、图像分割、图像识别提供可靠的支撑。
● 特征设计与提取:使用计算机提取图像信息,决定每个图像点是否属于同一个图像特征,最终的结果是把图像上的点分为不同的子集。特征提取的好坏对泛化性能有非常重要的影响。
● 特征汇聚或变换:对前一阶段提取的局部信息特征进行统计汇聚或者降维处理,然后降低维度对后续的分类或回归处理变得更加方便。
● 分类器/回归器的设计与训练:采用模式识别或机器学习方法(向量机、决策树、人工神经网络算法)训练出合理的模型。
3、计算机视觉涉及的关键技术
计算机视觉涉及的关键技术主要有图像分类、目标定位与跟踪、目标检测、图像语义分割。下面给大家逐一介绍。
3.1 图像分类
● 图像分类主要基于图像的内容对图像进行标记,然后根据计算机视觉模型预测出最合适的图像标签。图像分类属于计算机视觉技术重要的基础问题,也是活体检测、图像分割、行为分析、人脸识别的等高层视觉任务的基础。
● 图像分类的场景:交通领域的交通场景识别、医学领域的图像识别等等。
● 图像识别的难点:视点变化、图像变形、图像遮挡、照明条件等等。
● 训练图像分类任务常用的模型:AlexNet、VGG、GooLeNet、ResNet、Inception-v4、DPN、ShuffleNet等。
3.2 目标定位与跟踪
● 目标定位:主要是了解图像中的目标具体在图像的什么位置,目标定位通常以包围盒的形式返回。
● 目标跟踪:主要是在给定的场景中跟踪感兴趣的对象。目前最典型的案例就是无人驾驶。
3.3 目标检测
目标检测指的是用算法判断图片中是否包含特定的目标,并且在图像中标记特定目标的位置(红框把目标圈起来)。目标检测侧重于对特定目标的检索,一般情况下目标检测的目标必须有固定的形状和轮廓。
目标检测常用的模型:SSD模型、PyramidBox模型、R-CNN模型
3.4 图像语义分割
● 目的:将图像像素按照表达的语义含义的不同之处进行分组/分割。
● 图像语义:主要是对图像内容的理解(能够描述出图像中什么物体在哪里做了什么事情等等)。
● 图像分割:对图片中的每个像素点进行标注,标注其属于哪一类别。
● 分割任务:分为实例分割、语义分割,实例分割:是物体检测加语义分割的综合体。图像语义分割常用模型:R-CNN、ICNet、DeepLabv 。
● 使用场景:无人驾驶技术当中分割街景,从而达到规避行人车辆的问题、目前最火的美颜功能。