目标检测与生成对抗网络

2023-10-07 15:34:12 浏览数 (1)

1、A full data augmentation pipeline for small object detection based on generative adversarial networks

针对一般目标检测数据中小目标少而且难以标注的问题,基于GAN提出了一种用于小目标检测的数据增强的完整流程,该流程将基于GAN的目标生成器与目标分割、图像修复和图像混合技术相结合,以实现高质量的合成数据。

2、A Comprehensive Survey of Image Augmentation Techniques for Deep Learning

 本文提出了一种新的UDA模型,该模型集成了基于图像和特征级别的自适应,以解决跨域目标检测问题。采用生成对抗性网络和循环一致性损失的目标进行图像翻译。此外,提出了基于区域建议的特征对抗性训练和分类,以进一步最小化域偏移并保留目标域目标的语义。

3、ShipGAN: Generative Adversarial Network based simulation-to-real image translation for ships

 然而,生成图像和自然图像之间的风格差异会导致领域转移问题。因此,需要设计一种能够将模拟图像的数据分布和样式转移到现实领域的方法。本文提出并评估了一种新的解决方案来填补这一空白,该解决方案使用基于生成对抗网络的模型ShipGAN将模拟图像转换为真实图像。

4、A novel data augmentation scheme for pedestrian detection with attribute preserving GAN

小尺度和重叠目标,用GAN来做数据增强。

5、Progressive cross-domain knowledge distillation for efficient unsuperviseddomain adaptive object detection

域适配方法: 首先,通过图像到图像的转换应用像素级对齐,以减少不同域之间的外观差异。然后,利用焦点多领域鉴别器来训练师生对等网络,以合作的方式逐步提取领域自适应知识。最后,通过自适应教师检测器获得的可靠伪标签被进一步用于重新训练教师-学生模型。

6、Domain Adaptation for Object Detection via Style Consistency

域适配方法:提出了一种用于目标检测的领域自适应方法。第一步,我们使用风格转移方法将源图像的像素自适应到目标域。在风格转移图像和源图像之间的目标检测器的高级特征中强制执行低距离可以提高目标域中的性能。对于第二步,我们提出了一种稳健的伪标记方法来减少正采样和负采样中的噪声。

7、ForkGAN: Seeing into the Rainy Night

图像增强方法:提出了一种用于任务无关图像翻译的ForkGAN,它可以在恶劣的天气条件下增强多个视觉任务。提出了一个叉形循环生成模块,该模块可以在领域翻译过程中解耦领域不变的内容和领域特定的风格。我们强制两个编码器通过公共编码空间,并明确使用抗对比度损失,以确保在解纠缠中产生必要的不变信息。在每个生成器阶段引入了一个Fork分支,以确保为两个领域的图像识别任务保留足够的信息。使用ForkGAN在不利条件下提高了定位、语义分割和目标检测的性能。

8、GAN-Based Day-to-Night Image Style Transfer for Nighttime Vehicle Detection

图像增强方法:图像翻译算法在面临大而复杂的领域变化时,例如从白天到晚上,它们很容易在保留图像目标和保持翻译一致性方面失败。提出了AugGAN,这是一种基于GAN的数据增强器,可以将道路行驶图像转换到所需的域,同时可以很好地保留图像对象。这项工作的贡献有三个方面:(1)设计了一个结构感知的未配对图像到图像的翻译网络,该网络学习跨不同域的潜在数据转换,同时大大减少了转换图像中的伪影;(2) 定量地证明了车辆检测器的域自适应能力不受其训练数据的限制;(3) 在车辆检测方面,我们的目标保护网络在日夜困难的情况下提供了显著的性能增益。

9、Towards Instance-level Image-to-Image Translation

图像翻译算法面对目标域图像内容丰富且包含多个不一致的目标,则这种方法会严重导致矛盾。在本文中,提出了一种简单而有效的实例感知图像到图像的翻译方法,该方法在空间上对目标图像采用了隐含的局部(实例)和全局风格。所提出的INIT具有三个重要优点:(1)实例级目标损失可以帮助学习更准确的重建,并结合目标的不同属性;(2) 局部/全局区域的目标域所使用的样式来自源域中相应的空间区域,直观上是一种更合理的映射;(3) 联合训练过程既有利于细化粒度,也有利于粗粒度,并结合实例信息来提高全局翻译的质量。

10、Progressive Domain Adaptation for Object Detection

采用一个中间域来弥合领域差距,并逐步解决更容易的适应子任务。该中间域是通过翻译源域图像以模仿目标域中的图像来构建的。为了解决领域转移问题,我们采用对抗性学习来在特征级别对齐分布。此外,应用加权任务损失来处理中间域中的不平衡图像质量。

11、Generative Modeling for Small-Data Object Detection

 本文探讨了小数据模式下的目标检测,由于数据稀有和注释费用的原因,只有有限数量的注释边界框可用。这是当今的一个常见挑战,因为机器学习被应用于许多新任务,在这些任务中,获得训练数据更具挑战性,例如在医生一生中有时只看到一次罕见疾病的医学图像中。在这项工作中,我们从生成建模的角度探讨了这个问题,方法是学习生成具有相关边界框的新图像,并将其用于训练对象检测器。我们表明,简单地训练先前提出的生成模型并不能产生令人满意的性能,因为它们是为了图像真实性而不是目标检测精度而优化的。

12、Cross-Domain Car Detection Using Unsupervised Image-to-Image Translation: From Day to Night

数据增强:为此,探索了一个基于生成对抗网络的模型,以实现生成具有相应注释的人工数据集。人工数据集(假数据集)是将图像从白天时域转换到晚上时域而创建的。伪数据集仅包括目标域的注释图像(夜间图像),然后用于训练汽车检测器模型。

13、Let There Be Light: Improved Traffic Surveillance via Detail Preserving Night-to-Day Transfer

 然而,在夜间等不利条件下,目标检测的准确性会显著下降。该问题的主要原因之一是缺乏足够的夜间场景标签的检测数据集。本文提出了一个框架,通过使用图像翻译方法来缓解在不利条件下进行目标检测时精度下降的情况。利用基于风格翻译的StyleMix方法来获取白天图像和夜间图像对,作为后续夜间到白天图像翻译的训练数据。为了缓解生成对抗性网络(GANs)造成的细节破坏,我们建议利用基于核预测网络(KPN)的方法来重新定义夜间到日间的图像翻译。KPN网络与目标检测任务一起训练,以使训练的日间模型直接适应夜间车辆检测。车辆检测实验验证了该方法的准确性和有效性

0 人点赞