目标检测的定义

2022-09-04 22:12:22 浏览数 (1)

目标检测与识别是指从一幅场景(图片)中找出目标,包括检测(where)和识别(what)两个过程。任务的难点在于待检测区域候选的提取与识别,所以,任务的大框架为:

  • 首先建立从场景中提取候选区的模型
  • 然后识别候选区的分类模型
  • 最后精调分类模型的参数和有效候选框的位置精修

  目标检测与识别在生活中多个领域中有着广泛的应用,它是将图像或者视频中的目标与不感兴趣的部分区分开,判断是否存在目标,若存在目标则确定目标的位置,识别目标是一种计算机视觉任务。目标检测与识别是计算机视觉领域中一个非常重要的研究方向,随着互联网,人工智能技术,智能硬件的迅猛发展,人类生活中存在着大量的图像和视频数据,这使得计算机视觉技术在人类生活中起到的作用越来越大,对计算机视觉的研究也越来月火热。目标检测与识别,作为计算机视觉领域的基石,也越来越受到重视。在实际生活中应用也越来越广泛,例如目标跟踪,视频监控,信息安全,自动驾驶,图像检索,医学图像分析,网络数据挖掘,无人机导航,遥感图像分析,国防系统等。

  由于近年来目标检测与识别技术的火热发展,越来越多的相关研究成果发表在各种顶级期刊或者会议上,如TIP, CVIU, TPAMI, IJCV, CVPR, ICCV, ECCV, ACM MM等。在各国学者的共同努力下,目标检测与识别技术飞速发展,并使得最好的目标检测与识别算法在公开数据集上有着跨越式的进步,算法性能在不断地接近人类能力。

  如今,目标检测与识别的研究方法主要由两大类:

  • 基于传统图像处理和机器学习算法的目标检测与识别方法
  • 基于深度学习的目标检测与识别方法

1、基于传统图像处理和机器学习算法的目标检测与识别方法

  传统的目标检测与识别方法主要可以表示为:目标特征提取->目标识别->目标定位。

  这里所用到的特征都是认为设计的,例如SIFT (尺度不变特征变换匹配算法Scale Invariant Feature Transform), HOG(方向梯度直方图特征Histogram of Oriented Gradient), SURF( 加速稳健特征Speeded Up Robust Features),等。通过这些特征对目标进行识别,然后再结合相应的策略对目标进行定位。

2、基于深度学习的目标检测与识别方法

  如今,基于深度学习的目标检测与识别成为主流方法,主要可以表示为:图像的深度特征提取->基于深度神经网络的目标识别与定位,其中主要用到深度神经网络模型是卷积神经网络CNN。目前可以将现有的基于深度学习的目标检测与识别算法大致分为以下三大类

  • 基于区域建议的目标检测与识别算法,如R-CNN, Fast R-CNN, Faster R-CNN,Mask R-CNN;
  • 基于回归的目标检测与识别算法,如YOLO, SSD;
  • 基于搜索的目标检测与识别算法,如基于视觉注意的AttentionNet,基于强化学习的算法

0 人点赞