ORSIm:A Novel Object Detection Framework in Optical Remote Sensing Imagery Using Spatial-Feature

2022-09-23 18:44:59 浏览数 (1)

摘要

近年来,随着星载成像技术的飞速发展,光学遥感图像中的目标检测受到了广泛的关注。虽然许多先进的研究工作都使用了强大的学习算法,但不完全特征表示仍然不能有效地、高效地处理图像变形,尤其是目标缩放和旋转。为此,我们提出了一种新的目标检测框架,称为光学遥感图像检测器(ORSIm检测器),它集成了多种通道特征提取、特征学习、快速图像金字塔匹配和增强策略。ORSIm检测器采用了一种新颖的空频信道特征(SFCF),它综合考虑了频域内构造的旋转不变信道特征和原始的空间信道特征(如颜色信道和梯度幅度)。随后,我们使用基于学习的策略对SFCF进行了改进,以获得高级或语义上有意义的特性。在测试阶段,通过对图像域中尺度因子的数学估计,实现了快速粗略的通道计算。对两种不同的机载数据集进行了大量的实验结果表明,与以往的先进方法相比,该方法具有优越性和有效性。

1、简介

一般来说,光学遥感图像是从400 ~ 760nm范围内的机载或卫星源采集的。大量的多光谱图像和高分辨率RGB图像是免费的规模很大,有一个日益增长的兴趣在各种应用程序中,如降维,分割,分离,数据融合,目标detectionand跟踪[,和分类或识别。近年来,地理空间目标检测因其在环境监测、生态保护、灾害响应等方面的重要作用而受到广泛关注。然而,光学遥感图像不可避免地会受到各种变形的影响,如视点、尺度和方向的变化,导致检测算法性能下降。此外,光学遥感图像中的物体,如图1中的汽车和飞机,相对于背景杂乱的地面采样容抗(GSD),一般较小。为了克服这些困难,自20世纪80年代以来,遥感社区的目标检测得到了广泛的研究。

许多公共基准测试,如TAS aerialcar检测数据集、NWPU VHR-10数据集,都促进了人们对遥感目标检测领域的兴趣和进展。由于数据库的多样性,为了进一步提高检测性能,各种鲁棒方法层出不穷。现有的检测方法大致可以分为以下几种:基于模板匹配的、基于知识的、基于目标的、基于机器学习的方法和其他变体。这些方法大多无法在一个尺度密集的完整空间中描述对象特征。在我们的例子中,所谓的完全空间应该包含不同的特性,能够有效地抵抗各种变形,例如位移、旋转等。此外,一个好的图像描述符应该能够捕获具有粗图像金字塔结构的实体图像模式。在下一节:相关工作中,我们将详细介绍它们与我们的工作相关的细节,并阐明它们的相似之处、不同点以及优缺点。

A、动机和目标

目标物体变形(如旋转、平移)是图像重建或检测中常见的问题,但仍是一个具有挑战性的问题。特别是遥感图像由于其“鸟瞰图”,其旋转行为往往更为复杂(见图1)。虽然基于学习的方法,如深度神经网络(DNNs)、深度卷积神经网络(deep convolutional neural networks,深度CNNs)等,已经被提出通过人工增加不同旋转的训练集来学习旋转不变的特征,但是不可避免的会受到预先设置的旋转角度的限制。这可能很难自适应地解决分数角的旋转问题,从而产生性能瓶颈。另一个对检测性能有很大影响的重要因素是特征本身,它可以由DNN手动设计或提取。然而,如果没有大规模标记训练样本的强大支持,这种强大的学习方法无法提供更丰富的表示。

因此,我们主要致力于在Viola和Jones (VJ)提出的开创性的目标检测框架下,人为地开发或优化特征,使其朝着更具鉴别性的旋转不变表示方向发展,而不是本文中基于学习的方法。

B、方法概览和贡献

为了有效地解决上述问题,首先在极坐标下构造了自适应旋转不变信道特性,并从理论上证明了能够很好地适应任意角度的旋转。此外,在笛卡尔坐标(例如。为了充分挖掘特征表示的潜力,提出了一种联合空频信道特征(SFCF)。然后,我们逐步走向特征学习或细化(例如子空间学习、聚合通道特征(ACF)),以进一步细化表示。最后将这些特征输入到一个带有一系列深度-3决策树的增强分类器中。

针对遥感中的地理空间目标检测,提出了一种VJ目标检测框架的变体——ORSIm检测器(ORSIm检测器)。与以往中对平移和旋转敏感的模型不同,ORSIm检测器是一种更通用、更强大的框架,能够有效地抵抗各种变化,特别是对遥感图像。此外,在不牺牲检测性能的前提下,采用快速金字塔法对多尺度目标进行了有效的检测。图 2概述了ORSIm检测器的基本框架。我们工作的主要亮点有三方面。

  • 我们提出了一种基于基本VJ框架的ORSIm检测器,该检测器集成了空频通道特征(SFCF)、特征学习或细化、快速图像象素估计、和系综分类器学习(Ad-aboost);
  • 局部通道特性设计的同时考虑到旋转的不变性和转变为了处理复杂目标在遥感图像变形行为;
  • 图像金字塔生成模型是简单但有效地嵌入到该框架通过快速估计比例因子在图像域。

本文的其余部分组织如下。第二部分简要回顾了与我们密切相关的前期工作。第三部分描述了提出的框架,包括多倍域特征提取、特征栈、特征学习、训练和测试。第五部分总结了我们的工作,并简要讨论了今后的工作。

2、相关工作

介绍了几种先进的目标检测技术及其在遥感图像中的应用。我们还着重阐明了与三种与我们的工作部分相关的类似方法相比,我们的优势。

A、通道特征

通道特征是指通过输入图像的线性或非线性变换而得到的一组空间判别特征。在过去的几十年里,信道特征提取技术在行人检测、[30]和人脸检测中的应用越来越受到人们的关注。各种信道特征由于其高度的可表征性,在地理空间目标检测中得到了广泛的应用。Tuermeret al.利用方向梯度直方图(HOG)作为稠密城市场景中机载车辆检测的方向通道特征。不幸的是,单独使用方向特性很容易阻碍检测性能的进一步提高。Zhaoet al.受聚集通道特征(ACF)的启发,通过添加彩色通道特征(如灰度、RGB、HSVand LUV)来扩展通道特征,通过遥感图像对飞行器进行检测。然而,由于对物体旋转的敏感性,这些方法往往不能达到理想的性能。为此,虽然已经有许多尝试性的工作被提出来建模对象的旋转行为,但其性能仍然受到离散空间坐标系的限制。

在理论保证的基础上,Liu等人提出了一种面向梯度直方图(Fourier HOG),并给出了详细的数学证明。模型旋转不变描述符在一个连续的频域而不是在离散空间域使用Fourier-based卷积操作张量值变换函数

。这个函数将张量值的矢量化特征(例如HOG)转换为标量值的表示,从而使特征在最大化的信息获取下保持不变。与从位姿归一化离散计算局部估计坐标中的特征(或描述符)的类HOG方法不同,傅里叶HOG使用一个连续函数在连续坐标中拟合统计特征,如图3所示。此外,这种策略还可以避免HOG描述符的梯度binning和位姿采样中的伪影。

尽管FourierHOG在表示旋转不变性方面具有优越性,但它忽略了特征多样性的重要性。为此,所提出的ORSIm将单通道特征扩展到空间频率联合特征,从而进一步丰富了表示。另一方面,傅里叶hog将一个具有挑战性的目标检测问题简化为目标识别问题。具体来说,将检测物体边界框的任务转化为识别中心像素为物体或非物体的任务,如图4(a)所示。

B、特征通道尺度

图像多分辨率分解是目标检测和跟踪等高层次图像分析的关键技术之一。VJ框架是一个开创性的工作,实时目标检测,运行速度为每秒15帧(fps)的图像384×288像素与700 MHz英特尔奔腾III处理器。在此框架下,HOG产生了更高的检测精度。然而,两种具有代表性的算法均在对数空间中采样尺度,并对每个尺度构造一个特征金字塔。这是非常耗时的,保持计算成本低是一个重大的挑战。受自然图像分形统计的启发,Dollaret al.提出了一种只估计尺度因子的快速金字塔生成模型,基本实现了并行提取金字塔特征。模型中使用的关键技术可以总结为特征通道缩放,如图4(b)所示,其目标是利用图像的分形统计量计算精细采样的特征金字塔占总代价的比例。此外,为了在精细采样的金字塔上充分逼近特征,我们在八维尺度间隔上计算特征。因此,该模型成功地应用于8核机i7-870 PC上30帧以上的行人检测。同样,它也被证明是有效的飞机遥感图像检测。然而,一个重要的假设模型,即内容频道Ω任何低级移不变的应该是为了配合滑动窗口的操作,这使得快速检测框架角敏感variationor rotation-induced变形。因为这个原因,杨杰。试图通过从多视图图像中学习不同的人脸属性来放松约束。多视点遥感图像采集成本高,仍然阻碍了杨算法的推广。一致地,无论是颜色通道特性还是FourierHOG都能够促进快速金字塔生成模型的使用,而它们的联合使用(我们的SFCF)自然做得很好。

C、增强决策树

在机器学习领域,增强方法已经被广泛应用,并取得了巨大的成功,几十年来在不同的应用,如目标检测,人脸检测,位姿检测。与其他强大的分类器(例如,Rotation-based SVM,结构化的SVM,旋转森林),增强型的迭代选择弱学习者从候选人弱分类器从上一轮努力处理的例子,它们一边被视为一个增强模型集成前成绩,贪婪地最小化一个指数损失函数。每一个弱学习者都能对样本进行重估,然后弱学习者会更关注那些被前一个学习者错误分类的例子。利用该方法,可以获得具有较高泛化能力和参数自适应能力的强分类器。

基于助推器的分类器性能主要取决于特征的判别能力和弱分类器的数量。在下一节中,我们将介绍提出的统一框架(ORSIm检测器),用于语义有意义的特征提取、特征栈和学习以及增强分类器的参数选择。

3、方法论

提出的ORSIm检测器从特征提取器开始。该阶段联合提取空频通道特征,包括空间域的颜色和梯度幅度通道以及频域的旋转不变特征。这些特征可以通过子空间学习或ACF进一步细化,然后将其输入到增强决策树中,从而更好地进行训练和检测。算法1详细介绍了ORSIm检测器的主要程序。

A、空间通道频率特征

通常情况下,特征在一个域中的表示是有限的,这就促使了从空间域和频率域中联合提取更具鉴别性的特征,从而丰富了特征的多样性。

以RGB遥感影像

为输入,将FSFCF表示为SFCF,主要包括RGB通道、一阶GM通道和RI通道,定义为:

其中

代表不同的特征集。

(1)像素空间通道功能

在许多与遥感相关的任务中,颜色通道,即, RGB,在识别对颜色敏感的某些材料(如树木、草和土壤)方面表现出很强的能力,可以表示为

其中F表示信道特性。此外,RGB图像的归一化通用空间通道可以被看作是另一个重要的特性,因为它不仅可以提高目标边缘,但也突出了小突变,可以直观地忽略了图像的平滑区域,显示其有效性在探测空中或星载目标。得到的表达式是

(2)像素方向的频率通道特性

遥感图像中的物体往往会发生各种复杂的变形。应该指出,对象旋转是导致性能急剧下降的主要因素之一。与笛卡尔坐标下提取特征相比,旋转不变性在极坐标[27]下得到了更有效的分析,极坐标下的旋转不变性特征可以分别分离为角信息和径向基

。让

是一个复数的大小和相位

,dx和dy像素的水平和垂直梯度在笛卡尔坐标,分别。巧合的是,傅里叶基础

是一种最优选择角部分

,从理论上证明了在,

代表傅里叶秩序列。基函数

形成谐波在循环,称为循环谐波。在[27]中,傅里叶域中的旋转行为

可以用乘法或卷积算子来建模。更具体地说,给定极坐标(

)中的两个k阶傅里叶表示,我们有

相对旋转坐标变换。

给定任意一个像素(p),其k阶傅里叶表示(

)可以进一步推导:

是当前像素的分布函数,可以用带积分的脉冲函数来表示

(5)由一个旋转角αg时,根据旋转行为

,我们有

为了使特征RI即

,我们可以设置一组具有相同旋转行为的滤波器(卷积核),记为

。利用(4)-(6),可以表示为

只要满足

,就可以得到:

因此,卷积特征可以看作是最终的RI表示。

受上述旋转不变性理论推导的启发,我们构建了包含以下三部分的RI特征:

1)、对输入的遥感图像进行傅里叶变换,

阶傅里叶幅度通道图像自然是一种不变特征,记为

在像素方面(p)的形式。

2)、我们去除旋转信息从第一阶段通过使用(7)和(8),也就是说,我们生成一系列的傅里叶基础大小相等,方向相反顺序和使用它们的傅里叶表示我

乘法或卷积操作,可以制定

3)、因此,可以将两个相邻的kernel-radii(请参阅[27]了解更多细节)的卷积特性耦合起来,将其发展为一个特殊的RI特性,其表达式为

并且

代表不同的卷积内核。因此,基于像素的频道特征可以用:

因此,基于像素的频道特征可以用:

因此,我们通过收集所有基于像素的特性来获得图像级表示

3)、基于区域的信道特征表示:由于遥感图像的空间分辨率较低,其检测性能在很大程度上受到像素特征的限制。为了更好地捕获语义上下文信息,我们将pixelwise通道特性分组为具有不同大小内核函数的基于区域的特性。如图5所示,我们使用三角形卷积核,包括各向同性三角形核和局部归一化核,来提取空间域和频域的基于区域的信道特征。除此之外,我们还设计了一套基于傅里叶的卷积核表示

构建提出国际扶轮在频域描述符(请参阅[27]对具体详细卷积核的参数设置)。因此,最终得到的SFCF为

其中

是使用第j个卷积核的基于区域的特征。

B、特征学习或精炼

为了有效消除两个不同域之间的特征差距,同时为了提高其鲁棒性和代表性,我们可以使用以下两种策略沿空间方向和通道方向学习或细化特征立方体(见图6)。

模块1:

基于子空间的学习(例如,主成分分析(PCA))。提取的SFCF特征可以进一步学习,降低计算和存储成本,在一定程度上提高特征表示能力。

模块2:

基于聚合的池。通过池式操作(ACF)可以对SFCF进行细化,动态调整不同大小的支持区域,同时保持与整体图像的结构一致性。随后,将二维ACF扩展为一维全连接特征向量,使其更好地适合于集成分类器学习。受结构编码模式的启发,我们在特征细化过程中选择了ACF。

C、集成分类器学习的训练阶段

助推是目前最流行的学习技术之一,它将大量的弱学习者整合在一起,产生一个更强的学习者。基于启动的方法(如AdaBoost)是建立在这样一个事实之上的:所选的周分类器应该最小化训练错误,保持或减少测试错误。为此,我们采用了一种深度3决策树的软级联增强结构,该结构能够更有效地区分组内和样本间,同时在特征选择中发挥作用。值得注意的是,该学习策略对目标检测的背景干扰具有很强的鲁棒性,特别是在较为复杂的遥感图像场景中。

D、带有特征通道缩放的测试阶段

滑动窗口是一种常用的检测技术,在检测阶段对采集到的图像进行精细的采样。然而,它意味着沉重的计算成本,这在现实世界中不是一个好的工具。在我们的框架中,通过自动估计特征通道的比例因子,实现了一种快速的图像金字塔模型:

其中

是输入图像,

是由

重新采样的I的图像。

是一个比例因子估计。对应的s尺度的信道图像可由式(12)表示。通过对原始图像进行空间和频域的线性或非线性变换,可以计算出不同的信道。使用(12),我们可以很快获得所有的渠道特征金字塔图像使用给定的

值计算在训练阶段。

4、实验结果和分析

A、光学遥感数据集

在本节中,我们使用了两个著名的公共光学远程数据集,即卫星数据集3中的car目标和NWPU甚高频飞机数据集4中的飞机目标,来定量评估所提出方法的性能。在本文中,60%的样本被指定为训练集,剩下的是两个数据集的测试集。本文的主要研究重点是建立一种更鲁棒、更具鉴别性的特征表示方法,保证旋转和平移的不变性。一般来说,收集大量的训练样本是非常昂贵和耗时的,特别是标记遥感数据。因此,在训练集有限的情况下,对分类器的泛化性能进行评估是非常有意义和挑战性的。

(1)卫星数据集设置

该数据集取自谷歌Earth,由于建筑物阴影造成的低分辨率和不同的光照条件,使得该数据集非常具有挑战性。其中包含30张尺寸为792×636的图片,其中1319张是人工标注的车。在训练阶段,所有的车窗都重新调整为40×40,因为车窗的平均尺寸大约是这个尺寸。在所有的实验中,利用它们的镜像将正图像放大一倍作为数据扩充,避免了过度拟合,提高了泛化能力。同时,从226张没有汽车物体的自然图像中随机裁剪出负像。

(2) NWPU VHR-10数据集

该数据集由从谷歌Earth(空间分辨率0.5-2 m)和Vaihingen数据集(空间分辨率0.08 m)获取的10个不同的目标检测数据集组成。为了满足我们的实验假设,即我们主要针对那些具有高度旋转行为的物体进行检测,飞机是合适的研究对象,我们选择飞机作为我们的另一个实验数据来有效地评价我们的方法。更具体地说,没有任何异常值的正像集由650幅飞机图像组成,每幅图像至少包含一个目标。负像集由150张没有任何类相关目标的图像组成。原始的最大和最小窗口分别设置为130×120和40×40像素。另外,通过镜像处理,训练集中正面图像的数量增加了一倍,而负面图像是从100张没有飞机的图像中随机选取的。

B、实验步骤

本文的所有实验都是在Windows 7操作系统上用Matlab 2016实现的,并在Intel Xeon 2.6 GHz PC (CPU)上进行,内存为128-GB。此外,ORSIm框架中还有几个重要的模块,如SFCF提取、采样窗口、平滑、特征金字塔和分类器设置。我们将在下面逐步详细介绍。

1)、SFCF提取:

本案例中使用的信道特征主要包括两部分:空间信道特征和频率信道特征。前者涉及到颜色通道和梯度通道的大小,后者涉及到RI特征通道。更具体地说,选择RGB、LUV和HSV作为潜在的颜色空间。将梯度通道的幅值设为梯度振幅响应最大的通道的幅值。在RI通道中有三个部分,它们是真正的RI特征(相同的傅里叶级数,例如,

)、幅值特征和不同半径上的耦合特征(更多信息请参考[27])。在这个过程中,需要考虑两个参数,即卷积核的半径(r)和傅里叶的数量的订单(m)。我们分配五个尺度与六种不同的半宽度

的值r,即。σ= 6,r

,而m被设置为2,3,4,5。

2)、采样窗口:

由于场景中物体的分辨率不同,需要对物体(如车辆、飞机)进行上采样或下采样,使其大小一致。因此,我们尝试搜索最优的长宽比在一个适当的范围内,通过调整汽车卫星数据集至28×24、32×28、40×36和44×40以及飞机VHR-airplane访问量数据设置为56×56、64×64、72×72、80×80、88×88。

3)、平滑化:

平滑化操作已被证明对提高特征的表示能力是有效的。类似地,我们在特征计算之前(预平滑)和特征学习之后(后平滑)使用二项式滤波器进行平滑。在我们的设置中,过滤器半径设置为1。

4)、特征金字塔

在提出的ORSIm框架中采用中的快速特征金字塔,对特征通道进行粗采样,在不增加检测精度损失的前提下,加快硬负向挖掘和测试阶段的速度。我们以

的采样速率,对四种不同尺度(s = 1,2,4,8)的物体进行采样。最小的金字塔图像由采样窗口的大小决定,最大的金字塔图像与原始图像大小相同。

5)、分类器设置

AdaBoost是一种基于boostingbased的集成分类器学习,用于训练分类器。为了训练较强的学习者,我们使用加权多数投票的方法,结合那些多样化较弱学习者的假设,生成增强决策树。为了避免过度拟合,我们逐步将弱学习者的数量从32人增加到2048人。值得注意的是,在训练阶段和测试阶段使用的负样本是使用滑动窗口和粗采样的图像金字塔来选择的,而不是[27]中提出的基于点的算子。

6)、评价标准

采用精确回忆(precision - recall, PR)曲线、平均回忆(average precision, AP)、平均回忆(average recall, AR)、平均F1-score (average F1-score, AF)四项指标对检测效果进行定量评价。更准确地说,当检测边界框与地面真值框的重叠率超过50%时,计算为真阳性(TP);否则,为假阴性(FN)。因此,最终精度(P)由

计算,召回率(R)由

计算,F1得分由

计算。

C、实验结果

1)、分类器选择的讨论

如表二所示,基于SVMs或随机森林(RF)分类器的方法也取得了较好的效果。这激发了我们对研究分类器选择的极大兴趣。为此,我们使用了三种不同的分类器(如线性SVM、RF和AdaBoost)来评估四种不同特征描述符(HOG、ACF、Fourier HOG和我们的SFCF)下的检测性能,如表二所示。对于一个公平的比较,这三种分类器中使用的参数经过调优的训练集上的交叉验证。总体而言,线性SVM收益率相对贫穷的表演与射频的结果相比,因为射频比线性支持向量机更健壮的在某种程度上,尤其是当训练样本是有限的。此外,AdaBoost比其他两个分类器的性能更好。两个可能的因素可以解释这个结果。AdaBoost是一种基于助推器的集成分类器学习,它通过对大量的弱分类器进行加权来产生一个更健壮的强分类器。因此,与线性支持向量机相比,它在识别和分类方面具有更强的性能。另一方面,虽然RF和AdaBoost都是基于类增强策略,但是RF对每个子分类器的权值是相等的,AdaBoost通过迭代更新权值来自适应地对每个弱分类器进行权值。这使得Adaboost生成的最终分类器更适合当前数据集,从而获得更好的性能。

2)、性能比较的概述

定量评估该方法的检测性能,我们比较相关的几种先进的方法框架,比如exemplar-SVMs,rotation-aware特性,收集部分detectors-based, bag-ofwords与支持向量机(BOW-SVM),金字塔快速功能,你只看一次(YOLO2), 7和FourierHOG。图7给出了两组数据集上不同算法的PR曲线,表1分别给出了ap和平均运行时间的定量结果。据此,我们可以提出以下几点看法。由于使用了标准HOG特征和离散网格采样,样本支持向量机和旋转感知方法具有相似的性能。不足为奇的是,BOW-SVM和ACF的性能最差,因为它们忽略了局部特征之间的空间上下文关系,并且受到旋转相关表示能力的限制。虽然可以通过更深层次的网络建模和嵌入锚框来提高检测性能,但是YOLO2对于微小目标和任意一对相距不超过微小距离的目标都不具有鲁棒性。傅里叶HOG算法在两个数据集上的性能略低于我们的算法,但远优于其他算法,这表明基于点的特征表示对分辨率不敏感。正如所料,该ORSIm检测器在两个数据集上都大大优于其他研究方法,显示了其有效性和优越性。这也可以从表二中看出,ORSIm检测器的精度明显高于其他检测器,这是由于设计良好的SFCF和AdaBoost的使用。在表I中值得注意的是,具有快速特征金字塔的方法比不具有快速特征金字塔的方法检测速度更快。尽管速度变慢(相对于ACF和YOLO2较慢),但所提出的ORSIm检测器检测精度最高。

在视觉上,一些车顶被错误的识别为汽车,在运输车辆上也有一些检漏,如图8第一排所示。这可能是由于训练样本数量有限和班级分布不平衡造成的。此外,由于运输车辆是白色的,较弱的可见边缘可能会误导分类器。与复杂的城市场景中的汽车检测相比,当背景和目标的形状和颜色相似时,也会出现飞机的误检测,即,飞机的尾部[参见图9(a)]。但通过两步非最大抑制(NMS)算法[36]可以很好地解决这个问题。改进结果如图9(b)所示。

D、敏感度分析

我们实验分析和讨论了不同结构下ORSIm检测器的潜在影响,使之能够在更多的数据集中很好地推广。通过对训练集的五次交叉验证,最终确定最优组合。

(1)、朝向参数设置:

图10和图11显示了不同参数设置对两个使用的数据集的性能比较。更具体地说,LUV颜色空间在两个数据集上都比其他两个表现得更好,在将颜色通道与GM通道结合使用时表现得更明显。有趣的是,在添加RI特征通道之后,出现了类似的趋势,如图10和图11(c)所示。

我们还研究了径向剖面(卷积核的大小)和傅立叶阶(

)的影响,以及采样窗口的大小。观察到图10和11 (d)和(e),它们在一定范围内相对不敏感,因此,我们选择他们作为数据集和

,32×28的卫星数据集(r = 8, 80×80的访问量VHR-airplane数据集)。与传统的检测框架策略相同,为了使特征局部平滑和全局平滑,通常在检测算法运行前后进行预平滑和后平滑。选取不同的filter radii∈{0,1,2,3}进行平滑,实验结果如图10和图11(g)和(h)所示。我们简单地将预平滑和后平滑的半径设置为1,因为它们对不同的半径相对不敏感。在测试阶段,金字塔因素起着重要的作用,如图10和图11(i)所示。8个八度音阶的测试结果最好,与[28]基本一致。值得注意的是,最终的检测精度会随着弱分类器数量的增加而增加,但是计算量也会增加。作为权衡,在我们的情况下,该值设置为2048。

(2)对空间分辨率:

图像分辨率是影响检测性能的另一个重要因素,因此,我们着重评估不同分辨率的影响,为ORSIm检测器的使用找到合适的边界条件。详细地,我们采用不同的采样率对两个数据集来研究检测精度的灵敏度。从图12可以看出,当采样率在0.5左右时,性能开始退化,之后逐渐下降。需要注意的是,特征金字塔通常是测试阶段不可缺少的步骤。因此,这些检测方法实际上对不同的空间分辨率并不是很敏感,虽然较低的分辨率不可避免地会遭受信息丢失。此外,图8给出了一个可视化的例子,阐明了不同尺度的物体基本上可以被检测到,证明了ORSIm检测器对多分辨率图像的有效性。然而,这并不是说所提议的探测器能够处理各种变化。为此,我们对一个场景进行了高亮处理,给出了一些虚假的案例,如图9所示,在这个场景中,检测器用一个小阴影混淆了真实的飞机和它的尾部,从而导致了一些额外的红色假警报。这实际上是对象检测中比较常见的现象,而不是由于模型对输入图像[36]的空间分辨率的敏感性。一个可行的解决方案是使用两步NMS,如图9所示。

5、结论

目标旋转是光学遥感中目标检测与识别中一个常见而又具有挑战性的问题。为此,我们在ORSIm中提出了一个更完整的目标检测框架,称为ORSIm检测器,通过引入判别RI通道特征(SFCFs)、基于学习的特征细化、快速特征通道缩放技术以及基于boost的分类器学习。大量的实验结果表明,与以往的先进方法相比,ORSIm检测器具有更好的性能和更强的抗各种变形能力。在未来的工作中,我们将专注于微小的目标检测,并将提出的框架扩展到端到端的学习框架(例如,深度学习)。此外,我们将把二分类扩展到多目标检测。

0 人点赞