【目标检测】开源 | 山东师范&中科院--大规模Logo数据集,3000个类别,约20万手工标注对象和158652张图像!

2020-10-21 17:36:58 浏览数 (4)

论文地址: http://arxiv.org/pdf/2008.05359v1.pdf

代码: https://github.com/wangjing1551/logodet-3k-dataset

来源: 山东师范大学,中科院,国科大

论文名称:LogoDet-3K A Large-Scale Image Dataset for Logo Detection

原文作者:Jing Wang

内容提要

Logo检测在多媒体领域具有广泛的应用,如版权侵权检测、品牌知名度监测、社交媒体上的产品品牌管理等,因此越来越受到人们的重视。在本文中,我们介绍了LogoDet-3K,最大的具有完整标注的logo检测数据集,它有3000个logo类别,约20万手工标注的logo对象和158652张图像。与现有数据集相比,LogoDet-3K在类别和注释对象方面具有更高的综合覆盖率和更广泛的种类,因此LogoDet-3K为logo检测创建了一个更具挑战性的基准。我们描述了数据集的收集和注释过程,并与其他数据集比较分析logo检测的规模和多样性。我们进一步提出了一个强大的基线方法Logo-Yolo,它将Focal loss和CIoU loss合并到最先进的YOLOv3框架中,用于大规模logo检测,解决了多尺度对象、logo样本不平衡、边界盒回归不一致等问题。与YOLOv3相比,本文方法的平均性能提高了约4%,与已报道的几种LogoDet-3K深度检测模型相比,提高更大。对其他三个已有数据集的评价进一步验证了我们的方法的有效性,并证明了LogoDet-3K在logo检测和检索任务上的更好的泛化能力。

主要框架及实验结果

声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除。

1 人点赞