论文地址: http://arxiv.org/pdf/2008.05359v1.pdf
代码: https://github.com/wangjing1551/logodet-3k-dataset
来源: 山东师范大学,中科院,国科大
论文名称:LogoDet-3K A Large-Scale Image Dataset for Logo Detection
原文作者:Jing Wang
内容提要
Logo检测在多媒体领域具有广泛的应用,如版权侵权检测、品牌知名度监测、社交媒体上的产品品牌管理等,因此越来越受到人们的重视。在本文中,我们介绍了LogoDet-3K,最大的具有完整标注的logo检测数据集,它有3000个logo类别,约20万手工标注的logo对象和158652张图像。与现有数据集相比,LogoDet-3K在类别和注释对象方面具有更高的综合覆盖率和更广泛的种类,因此LogoDet-3K为logo检测创建了一个更具挑战性的基准。我们描述了数据集的收集和注释过程,并与其他数据集比较分析logo检测的规模和多样性。我们进一步提出了一个强大的基线方法Logo-Yolo,它将Focal loss和CIoU loss合并到最先进的YOLOv3框架中,用于大规模logo检测,解决了多尺度对象、logo样本不平衡、边界盒回归不一致等问题。与YOLOv3相比,本文方法的平均性能提高了约4%,与已报道的几种LogoDet-3K深度检测模型相比,提高更大。对其他三个已有数据集的评价进一步验证了我们的方法的有效性,并证明了LogoDet-3K在logo检测和检索任务上的更好的泛化能力。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除。