简读分享 | 汪逢生 编辑 | 乔剑博
论文题目
Implicit Motion Handling for Video Camouflaged Object Detection
论文摘要
视频伪装物体检测(Video Camouflaged Object Detection,VCOD)是找出视频中在外观上与背景展现出极高相似性的物体的任务。本文提出了 SLT-Net,一个用于解决 VCOD 任务的新模型。该模型利用短期动态与长期一致性信息,在视频中检测伪装物体。此外,本文基于 MoCA(Moving Camouflaged Animals),重新整理并构建了一个大规模的 VCOD 数据集, MoCA-Mask。本文还提供了该领域第一个全面的评测基准,包含对已有的 VCOD 以及相关方法的测评。本文的贡献点概括如下: 本文提出了一个新的 VCOD 框架,它可以有效地建模视频中的短期动态与长期一致性。其中,伪装物体运动与分割可以同时被优化。 本文构建了第一个大规模 VCOD 数据集,MoCA- Mask,以促进 VCOD 领域的发展。 在 VCOD 任务上,本文的方法达到了当前最好的结果,超过之前的 SOTA 模型达 9.88%。
论文链接
https://openaccess.thecvf.com/content/CVPR2022/papers/Cheng_Implicit_Motion_Handling_for_Video_Camouflaged_Object_Detection_CVPR_2022_paper.pdf