目标检测和分类的域适配研究简述

2022-09-02 21:42:59 浏览数 (1)

1、检测

1、Progressive Domain Adaptation for Object Detection 2020年

本文们提出用中间域来弥补域之间的差距,逐步解决更容易的适应子任务。该中间域是通过对源图像进行转换来模拟目标域内的图像来实现的。为了解决领域转移问题,我们采用对抗性学习来在特性级别上对齐发行版本。此外,采用加权任务损失的方法处理中间域的不平衡图像质量。实验结果表明,该方法在目标域上的性能优于现有方法。

2、Adapting Object Detectors via Selective Cross-Domain Alignment 2019年

最先进的目标检测器通常是在公共数据集上训练的。当应用到不同的领域时,通常会遇到很大的困难,因为这些领域的成像条件差别很大,并且无法获得相应的注释数据(或者获取费用昂贵)。一种自然的补救方法是通过对齐两个域上的图像表示来调整模型。这可以通过对抗性学习来实现,并且在图像分类等任务中被证明是有效的。但是,我们发现在目标检测中,这种方法所取得的改进是非常有限的。一个重要的原因是,传统的领域适应方法努力将图像作为一个整体进行对齐,而目标检测,从本质上来说,关注的是可能包含感兴趣的目标的局部区域。基于此,我们提出了一种新的领域适应方法用于目标检测,以处理“在哪里看”和“如何对齐”的问题。我们的关键思想是挖掘有区别的区域,即那些直接与目标检测相关的区域,并专注于跨两个域对齐它们。实验表明,在各种领域转移场景下,该方法的性能显著优于现有方法,改进幅度约为4% ~ 6%,同时保持了良好的可伸缩性。

3、Few-shot Adaptive Faster R-CNN 2019年

为了减小域漂移导致的检测性能下降,我们提出了一种新的小样本自适应方法,该方法只需要少量的目标域图像和有限的边界框标注。为此,我们首先观察到几个重大挑战。首先,目标域数据严重不足,使得现有的大部分域适应方法无效。其次,目标检测涉及到同时进行定位和分类,进一步复杂化了模型的适应过程。第三,模型存在过适应(类似于用少量数据示例进行训练时的过拟合)和不稳定风险,可能导致目标域检测性能下降。为了解决这些问题,我们首先引入了源和目标特征的配对机制,以缓解目标域样本不足的问题。然后,我们提出了一种双级模块来将源训练的检测器适应于目标域:1)基于分割池的图像级自适应模块统一提取并比对不同比例和高宽比的位置局部patch特征;2)实例级自适应模块在语义上对齐成对的对象特性,同时避免类间的混淆。同时,采用源模型特征正则化(SMFR)方法稳定了两个模块的自适应过程。结合这些贡献,给出了一种小样本自适应快速rcnn框架,称为FAFRCNN,它能有效地适应具有少量标记样本的目标域。多数据集实验表明,我们的模型在感兴趣的少镜头域自适应(FDA)和无监督域自适应(UDA)条件下都取得了最新的性能。

4、Self-Training and Adversarial Background Regularization for Unsupervised Domain Adaptive One-Stage Object Detection 2019年

基于深度学习的对象检测器有了显著的改进。然而,当列车数据和测试数据具有不同的分布时,基于监督学习的方法表现不佳。为了解决这个问题,领域适应将知识从标签充足的领域(源领域)转移到标签缺乏的领域(目标领域)。自训练有助于类域适应,是实现域适应的有效途径之一。不幸的是,使用伪标签作为ground-truth的幼稚方法会由于错误的伪标签而降低性能。提出了一种基于弱自训练(WST)和敌对背景分数正则化(BSR)的区域自适应单阶段目标检测方法。WST降低了伪标签不准确对学习过程的负面影响,稳定了学习过程。BSR帮助网络提取目标背景的识别特征,减少领域位移。这两个组成部分是互补的,因为BSR加强了前景和背景之间的区别,而WST加强了阶级区分。实验结果表明,该方法有效地提高了无监督区域自适应设置下的单阶段目标检测性能。

5、A Robust Learning Approach to Domain Adaptive Object Detection 2019年

在目标检测的实际应用中,域漂移是不可避免的。例如,在自动驾驶汽车中,目标域由不受约束的道路环境组成,这些环境在训练数据中是不可能全部观察到的。同样,在监视应用程序中,由于隐私规定,可能缺乏足够有代表性的培训数据。在本文中,我们从鲁棒学习的角度来解决领域自适应问题,并证明了这个问题可以用带噪声标签的训练来表述。我们提出了一个健壮的对象检测框架,该框架对边界框、类标签、位置和大小标注中的噪声具有弹性。为了适应域的移动,在目标域上训练模型,使用在源域上训练的检测模型得到的一组有噪声的目标边界盒。我们评估了我们的方法在各种源/目标域对中的准确性,并证明了该模型显著改善了SIM10K、城市景观和KITTI数据集上的多域适应场景的最新水平。

6、Multi-adversarial Faster-RCNN for Unrestricted Object Detection 2019年

传统的目标检测方法本质上是假设训练和测试数据都是在一个有限制的目标域内采集的,具有昂贵的标记代价。为了缓解领域依赖和标注繁琐的问题,本文提出利用具有足够标签的辅助源领域训练出的领域知识来检测不受限制环境下的目标。具体地说,我们提出了一个多对抗式快速- rcnn (MAF)框架用于不受限制的目标检测,该框架内在地解决了域视差最小化以在特征表示中实现域适应。本文的优点有三方面:1)针对图像分布导致的域视差问题,提出了一种层次域特征对齐模块,该模块设计了多个对立的域分类器子模块,用于分层的域特征混淆;2)提出了一种用于分级特征图调整大小的信息不变尺度缩减模块(SRM),以提高对抗性域自适应的训练效率;3)为了提高区域适应性,将与检测结果相结合的建议特征输入到提出的加权梯度反转层(WGRL)中,用于描述难混淆的区域样本。我们在不受限制的任务中评估MAF,包括Cityscapes、KITTI、Sim10k等,实验显示了现有检测器的最先进性能。

7、Cross-Domain Weakly-Supervised Object Detection through Progressive Domain Adaptation 2018年

在没有实例级注释的情况下,我们可以检测各种图像域中的常见对象吗?在本文中,我们提出了一个新的任务框架,跨域弱监督目标检测,解决了这个问题。对于本文,我们可以访问源域中具有实例级注释的图像(如自然图像)和目标域中具有图像级注释的图像(如水彩图像)。此外,目标域中要检测的类是源域中的所有类或类的子集。从一个在源域上预先训练的完全监督的目标检测器开始,我们提出了一种两步渐进的域适应技术,通过对人工和自动生成的两种类型的样本对检测器进行微调。我们在新收集的包含三个图像域的数据集上测试了我们的方法,与性能最好的基线相比,在平均平均精度(mAP)方面取得了大约5到20个百分点的改进。

8、Domain Adaptive Faster R-CNN for Object Detection in the Wild 2018年

目标检测通常假设训练和测试数据是从一个相同的分布中提取的,然而,在实践中并不总是如此。这种分布不匹配将导致显著的性能下降。在这项工作中,我们的目标是提高目标检测的跨域鲁棒性。我们在两个层次上处理域移位:1)图像层次的移位,比如图像样式、光照等;2)实例层次的移位,比如对象外观、大小等。我们基于最近最先进的更快的R-CNN模型建立我们的方法,并在图像级和实例级设计了两个领域适应组件,以减少领域差异。这两个领域适应构件都是基于h -散度理论,通过对抗性训练的方式学习一个领域分类器来实现的。在更快的R-CNN模型中,通过一致性正则化进一步加强不同层次的域分类器来学习域不变区域建议网络(RPN)。我们使用包括Cityscapes、KITTI、SIM10K等在内的多个数据集来评估我们新提出的方法。结果表明,我们提出的方法是有效的鲁棒目标检测在各种领域的移动场景。

9、Domain Adaptation of Deformable Part-Based Models 2014年

当训练数据(源域)和应用场景(目标域)存在内在差异时,对象分类器的准确性会显著下降。因此,使分类器适应它们必须操作的场景是极其重要的。提出了一种新的区域自适应(DA)方法用于目标检测。作为概念上的证明,我们专注于采用最先进的基于变形部分的模型(DPM)进行行人检测。我们引入了一种自适应结构支持向量机(a - ssvm),它可以在不同的领域之间适应预先学习的分类器。通过考虑特性空间中的固有结构(例如DPM中的部件),我们提出了一个结构感知的a - ssvm (SA-SSVM)。A-SSVM和SA-SSVM都不需要重新访问源域培训数据来执行适应。相反,只使用少量的目标域训练示例(例如行人)。为了解决没有目标域注释样本的情况,我们提出了一种基于自适应学习(SPL)策略和高斯过程回归(GPR)的自适应DPM。评估了两种类型的适应任务:从合成行人和一般人(PASCAL VOC)到从车载摄像机拍摄的行人图像。结果表明,我们的建议避免精度下降高达15点时,比较适应和非适应探测器。

10、LSDA: Large Scale Detection through Adaptation 2014年

缩放目标检测的一个主要挑战是很难获得大量类别的标记图像。最近,深度卷积神经网络(CNNs)在物体分类的基准测试中脱颖而出,部分原因是它训练了120万多张标记分类图像。不幸的是,这些标签中只有一小部分可用于检测任务。从搜索引擎中收集大量图像级标签要比收集检测数据并用精确的边框标记要便宜和容易得多。在本文中,我们提出了大规模自适应检测(LSDA)算法,该算法学习到两种任务之间的区别,并将这种知识转移到没有边框标注数据的类别分类器中,使其成为检测器。我们的方法可以检测成千上万个类别,这些类别没有边框标注,但有大量的分类数据。对ImageNet LSVRC-2013检测挑战的评估证明了我们的方法的有效性。该算法通过使用ImageNet树中的叶节点的可用分类数据,使我们能够生成7.6K的检测器。我们还演示了如何修改我们的体系结构来生成一个快速检测器(7.6K检测器以2fps运行)。

2、分类

1、Unsupervised Domain Adaptation by Backpropagation 2014年

性能最好的深层架构是在大量标记数据上进行训练的。在某项任务缺少标记数据时,域适应通常提供了一个有吸引力的选择,因为可以获得性质相似但来自不同领域的标记数据(例如合成图像)。在此,我们提出了一种新的领域适应方法,该方法可以训练来自源域的大量标记数据和来自目标域的大量未标记数据(不需要标记目标域数据)。随着训练的进行,该方法促进了“深度”特征的出现,这些特征(i)对源域上的主要学习任务具有区分能力,(ii)对于域之间的转换不变性。我们表明,这种适应行为可以在几乎任何前馈模型中实现,通过增加少量的标准层和一个简单的新的梯度反转层。由此产生的增强架构可以使用标准的反向传播进行训练。总的来说,使用任何深度学习包都可以轻松实现这种方法。在一系列的图像分类实验中,该方法取得了良好的分类效果,在大域移位的情况下取得了较好的自适应效果,并且在Office数据集上取得了较好的效果。

2、Learning Transferable Features with Deep Adaptation Networks 2015年

最近的研究表明,深度神经网络可以学习可转移的特征,这些特征可以很好地应用于新的领域适应任务。然而,随着深度特征沿着网络由一般特征向特定特征过渡,特征在较高层次上的可移动性显著下降,领域差异增大。因此,正式地减少数据集偏差和增强任务特定层的可转移性是很重要的。本文提出了一种新的深度自适应网络结构,将深度卷积神经网络推广到领域自适应场景中。在DAN中,所有特定任务层的隐藏表示法都嵌入到一个复制的核hilbert空间中,在这个空间中,不同域分布的主题嵌入可以显式匹配。采用最优多核选择方法进行均值嵌入匹配,进一步减小了域差异。DAN可以在统计保证的情况下学习可转移特征,并通过核嵌入的无偏估计来实现线性尺度扩展。大量的经验证据表明,提出的架构产生了最先进的图像分类错误率的标准领域适应基准。

3、Simultaneous Deep Transfer Across Domains and Tasks 2015年

最近的报告表明,一个在大规模数据集上训练的通用的监督深度CNN模型可以减少数据集偏差,但不能消除数据集偏差。在一个新的领域中对深层模型进行微调需要大量的标记数据,这对于许多应用程序来说是不可用的。我们提出了一种新的CNN结构来利用未标记和稀疏标记的目标域数据。该方法同时优化了域不变性以促进域传输,并使用软标签分布匹配丢失来实现任务间的信息传输。我们提出的适应方法在监督和半监督适应环境下评估了两个标准的视觉域适应任务,其经验性能超过了之前发表的结果。

4、REVISITING BATCH NORMALIZATION FOR PRACTICAL DOMAIN ADAPTATION 2016年

深度神经网络(DNN)在图像分类和目标检测等计算机视觉应用中取得了前所未有的成功。然而,在训练阶段这仍然是一个常见的烦恼,一个人必须准备至少数以千计的标记图像,以微调网络到一个特定的领域。最近的研究表明,DNN对训练数据集有很强的依赖性,如果不进行微调,学习到的特征很难转移到不同但相关的任务中。在本文中,我们提出了一个简单而强大的补救措施,即自适应批处理归一化(AdaBN),以提高一个DNN的泛化能力。该方法通过调整网络上各批处理归一化层的统计量,实现了域自适应任务的深度自适应。与其他深度学习领域自适应方法不同,该方法不需要额外的组件,且不需要参数。它的档案最先进的表现,尽管它令人惊讶的简单。此外,我们证明了我们的方法与其他现有的方法是互补的。将AdaBN与现有的领域适应处理相结合可以进一步提高模型性能。

5、Coupled Generative Adversarial Networks 2016年

我们提出耦合生成对抗网络(CoGAN)来学习多域图像的联合分布。现有的方法要求训练集中不同区域对应图像的元组,而CoGAN可以学习不需要任何对应图像元组的联合分布。它可以通过从边缘分布中抽取样本来学习联合分布。这是通过强制执行一个权值分配约束来实现的,该约束限制了网络容量,有利于联合分布解决方案而不是边际分布的乘积。我们将CoGAN应用于多个联合分布学习任务,包括学习颜色和深度图像的联合分布,以及学习具有不同属性的人脸图像的联合分布。对于每个任务,它成功地学习了联合分布,而不需要相应的图像元组。我们还演示了它在领域适应和图像变换方面的应用。

6、Unsupervised Domain Adaptation with Residual Transfer Networks 2016年

深度神经网络最近的成功依赖于大量的标记数据。对于没有标记数据的目标任务,域适应可以将学习者从不同的源域转移过来。本文提出了一种新的深度网络域自适应方法,它可以同时从源域的标记数据和目标域的未标记数据中学习自适应分类器和可转移特征。我们放松了以前方法所做的共享分类器假设,并假设源分类器和目标分类器之间存在一个残差函数。我们使分类器自适应,通过插入数层深度网络显式学习残差函数参考目标分类器。我们将多层特征嵌入到重建核希尔伯特空间(RKHSs)中,并匹配特征分布进行特征适应。采用新的残差层和损失函数扩展前馈模型,可以有效地训练前馈模型的自适应行为。经验证据表明,该方法在标准领域自适应数据集上优于现有的方法。

7、Deep Transfer Learning with Joint Adaptation Networks 2016年

深度网络已经成功地应用于学习可转移的特征,使模型从一个源域适应到另一个目标域。在本文中,我们提出了联合自适应网络(JAN),它通过基于联合最大平均误差(JMMD)准则来调整多个领域特定层的联合分布来学习传输网络。采用对抗性训练策略最大化JMMD,使源域和目标域的分布更容易区分。学习可以用线性时间内由反向传播计算出的梯度进行随机梯度下降。实验证明,我们的模型在标准数据集上产生了最新的结果。

8、Deep CORAL: Correlation Alignment for Deep Domain Adaptation 2016年

深度网络已经成功地应用于学习可转移的特征,使模型从一个源域适应到另一个目标域。在本文中,我们提出了联合自适应网络(JAN),它通过基于联合最大平均误差(JMMD)准则来调整多个领域特定层的联合分布来学习传输网络。采用对抗性训练策略最大化JMMD,使源域和目标域的分布更容易区分。学习可以用线性时间内由反向传播计算出的梯度进行随机梯度下降。实验证明,我们的模型在标准数据集上产生了最新的结果。

9、Adversarial Discriminative Domain Adaptation 2017年

对抗性学习方法是一种很有前途的训练鲁棒深度网络的方法,可以产生复杂的样本跨不同的领域。尽管存在域偏移或数据集偏差,它们也可以提高识别能力:最近引入了一些对抗的无监督域自适应方法,它们可以减少训练和测试域分布之间的差异,从而提高泛化性能。之前的生成方法显示出引人注目的可视化效果,但在有区别的任务上不是最佳的,并且可以限制在较小的转变。先前的区分方法可以处理更大的领域转移,但强加在模型上的权重,并没有利用基于gan的损失。我们首先为对抗适应勾勒出一个新的广义框架,它将最近最先进的方法作为特例纳入其中,并且我们使用这个广义的观点来更好地关联之前的方法。我们提出了一个以前未开发的例子,我们的一般框架结合了歧视建模,无约束的权重共享,和GAN损失,我们称之为对抗歧视领域适应(ADDA)。我们证明了ADDA比领域对抗性的方法更有效,也更简单,并且通过在标准的跨领域数字分类任务和新的更困难的跨模态目标分类任务上超越最先进的无监督自适应结果,证明了我们的方法的前景。

10、CENTRAL MOMENT DISCREPANCY (CMD) FOR DOMAIN-INVARIANT REPRESENTATION LEARNING 2017年

研究了神经网络在域自适应背景下的域不变表示的学习。我们提出了一种新的正则化方法,最大限度地减少了隐藏激活空间中特定领域的潜在特征表示之间的差异。虽然存在一些标准分布匹配方法可以解释为矩的加权和的匹配,如最大平均偏差,但一个显式的高阶矩的顺序匹配之前没有考虑。我们提出利用阶矩差来匹配概率分布的高阶中心矩。我们的模型不需要计算昂贵的距离和核矩阵计算。利用矩序列对概率分布的等价表示,定义了一个新的距离函数,称为中心矩差(CMD)。证明了CMD是紧区间上概率分布集上的一个度量。我们进一步证明了概率分布在紧区间上的收敛性。新的度量意味着各随机变量的分布是收敛的。我们在两个不同的基准数据集上测试我们的方法,分别用于对象识别(Office)和产品评论情绪分析(Amazon评论)。CMD在办公室的大多数领域适应任务上取得了最新的最先进的性能,在Amazon评论上优于那些训练了最大平均差异、变分公平自编码器和领域对抗神经网络的网络。参数敏感性分析表明,该方法在一定区间内的参数变化是稳定的。实验的源代码是公开的1。

0 人点赞