获取完整原文和代码,公众号回复:09110216640
论文地址: http://arxiv.org/pdf/2012.03400v1.pdf
代码: 公众号回复:09110216640
来源: 伊利诺伊大学香槟分校
论文名称:CompFeat: Comprehensive Feature Aggregation for Video Instance Segmentation
原文作者:Yang Fu
内容提要
视频实例分割是一项复杂的任务,我们需要检测、分割和跟踪给定视频中的每个对象。以前的方法只使用单帧特征来检测、分割和跟踪对象,在视频场景中,由于一些独特的挑战,如运动模糊和剧烈的外观变化,它们会受到影响。为了消除仅使用单帧特征所带来的歧义,我们提出了一种新的综合特征聚合方法(CompFeat),利用时间和空间上下文信息在帧级和对象级细化特征。在聚合过程中精心设计了一种新的注意机制,显著提高了学习特征的辨别能力。我们通过结合特征相似性和空间相似性的暹罗设计进一步提高了我们模型的跟踪能力。在YouTubeVIS数据集上进行的实验验证了本文算法的有效性。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。