什么是计算机视觉?
计算机视觉被认为是机器学习和人工智能发展的重要领域之一。简而言之,计算机视觉是人工智能研究领域,致力于赋予计算机看世界和视觉解释世界的能力。
更进一步的说,计算机视觉是一门研究如何使机器“看”的科学,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
计算机视觉的应用非常广泛,从自动驾驶汽车和无人机到医疗诊断技术和面部识别软件,计算机视觉的应用是巨大的和革命性的。
图像标注
图像标注是计算机视觉的一个子集,是计算机视觉的重要任务之一。图像标注就是将标签附加到图像上的过程。这可以是整个图像的一个标签,也可以是图像中每一组像素的多个标签。这些标签是由人工智能工程师预先确定的,并被选中为计算机视觉模型提供图像中所显示的信息。
一个简单的例子就是为人类标注者提供动物的图像,并让他们用正确的动物名称为每个图像进行标记。当然,标记的方法依赖于项目所使用的图像标注类型。这些带标签的图像有时被称为真实数据,然后将被输入计算机视觉算法。通过训练,最后该模型将能够从未注释的图像中区分不同种类的动物。虽然上面的例子非常简单,但进一步深入到计算机视觉更复杂的领域(如自动驾驶汽车),则就会需要更复杂的图像标注。
由于计算机视觉研究的是模仿或超越人类视觉能力的机器开发,训练这样的模型需要大量的带标注的图像。
你用来训练、验证和测试你的计算机视觉算法的图像将对你的人工智能项目的成功产生重大影响。数据集中的每张图像都必须经过深思熟虑和准确的标记,以训练人工智能系统像人类一样识别物体。图像标注的质量越高,机器学习模型的性能就可能越好。
如果没有图像标注,那些令人惊叹的计算机视觉技术都不可能实现。根据项目的不同,每个图像上的标签数量可能会有所不同。一些项目将只需要一个标签来表示整个图像的内容(图像分类)。其他项目可能需要在单个图像中标记多个对象,每个对象带有不同的标签。这些标签通常由计算机视觉科学家或机器学习工程师预先确定。
如何进行图像标注?
要创建带标签的图像,需要三件事:
1)、图片
2)、有人给图片加注释
3)、一个给图片做标注的平台
大多数图像标注项目都是从寻找和培训注释人员来执行标注任务开始的。人工智能是一个非常专业的领域,但人工智能训练数据标注并不总是必需的。虽然你需要机器学习方面的高等教育才能创造一辆自动驾驶汽车,但你不需要硕士学位就可以在图像中画汽车周围的方框(边界框注释)。因此,大多数标注者不需要机器学习方面的学位。
但是,这些标注人员应该对每个标注项目的规范和指导方针进行全面的培训,因为每个公司都有不同的需求。一旦标注人员接受了如何标注数据的培训,他们就可以在专门用于标注图像的平台上标注成百上千的图像。这个平台是一个软件,它应该具有执行特定类型标注所需的所有工具。
常用图像标注类型
1)、 2D和3D包围框
使用2D边框,标注者必须在他们想要在图像中注释的对象周围绘制一个框。有时这些目标对象将是相同的,即“请在图中的每辆自行车周围画框。”
其他时候,可能会有多个目标对象,“请在图中每辆车、行人和自行车周围画框。”在这种情况下,在画出框后,标注者将不得不从标签列表中选择属性给框中的对象。
3D包围盒也被称为长方体,除了它们还可以显示被标注的目标对象的大致深度之外,它们几乎与2D包围盒一样。与2D边界框标注类似,标注器在目标对象周围绘制框,确保在对象的边缘放置锚点。有时目标对象的一部分可能被阻挡。在这种情况下,标注器会估计目标对象阻塞边缘的位置。
2)、图像分类
边界框处理在一个图像中标注多个对象,而图像分类是将整个图像与一个标签关联的过程。一个简单的图像分类的例子是标记动物的类型。注释者会得到动物的图片,并要求他们根据动物种类对每张图片进行分类。
把这些带注释的图像数据输入计算机视觉模型,可以让模型了解每种动物特有的视觉特征。理论上,该模型将能够将新的未注释的动物图像归类到适当的物种类别中。
3)、线条和样条
线条和样条注释,顾名思义,就是对图像上直线或曲线的标注。注释人员的任务是注释车道、人行道、电力线和其他边界指示器。用线条和样条标注的图像主要用于车道和边界识别。此外,它们也经常被用于无人机的轨迹规划。
从自动驾驶汽车、无人机到仓库中的机器人等等,线条和样条标注在各种用例中都很有用。
4)、多边形
有时,不规则形状的目标对象不容易用边界框或长方体来标注。多边形注释允许注释器在目标对象的每个顶点上绘制点。这个注释方法允许对对象的所有精确边进行注释,而不管它的形状如何。
与边界框一样,带注释的边缘内的像素也将被标记为描述目标对象的标签。
5)、 语义分割
边界盒、长方体和多边形都处理在图像中标注单个对象的任务。而语义分割则是对图像中每一个像素的进行标注。不需要给标注者一个要标注的对象列表,而是给他们一个分段标签列表,以便将图像分成几个部分。比如,自动驾驶汽车的交通图像语义分割就是一个很好的例子,一个典型的语义分割任务可能会要求标注者通过区别“汽车”、“自行车”、“行人”、“障碍物”、“人行道”、“机动车道”和“建筑物”来分割图像。
图像标注的实际应用领域
1)、人脸识别
图像标注的一个常见应用是面部识别。它包括从人脸图像中提取相关特征,以区分图像中的人和物体。
利用关键点和地标等图像标注技术,通过轨迹指向对人脸不同部位的不同点进行跟踪,增强了人脸识别算法的有效性。
2)、农业技术
图像标注技术已被应用于农业技术行业的各种任务中。通过识别病害和健康作物的图像来检测植物病害,可以通过使用边界框或语义分割类型来实现。这是图像标注在农业技术中最基本的应用之一。
3)、安全系统
图像标注可以在安全系统中使用安全摄像头标记物品,比如某些特定区域中的可疑包裹。通过语义分割将视频区域划分为受限区域和非受限区域,可以实现这一目的。图像标注也可用于检测某些可疑的活动。
4)、电子商务
图像标注用于改进产品列表,还有助于确保客户找到他们正在寻找的正确产品。这可以通过在搜索查询和产品标题中标记各种组件的语义分割实现。
5)、机器人
图像标注的主要应用之一是机器人技术,它帮助机器人区分周围环境中的各种物体。