业内最大规模多标签图像数据集开源 | GitHub资源

2018-11-05 17:42:16 浏览数 (1)

允中 发自 凹非寺 量子位 报道

开源地址来了。

上个月,腾讯AI实验室宣布开源多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101.

现在,GitHub地址传送如下:

https://github.com/Tencent/tencent-ml-images

开源内容包含3方面:

  • ML-Images数据集的全部图像URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和URLs自行下载图像。
  • ML-Images数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。
  • 完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于ML-Images的预训练,基于ImageNet的迁移学习,到基于训练所得模型的图像特征提取的完整流程。 该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。 该项目还提供了非常高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

最后,关于腾讯本次开源详情解读,可移步前情报道:腾讯开源业内最大多标签图像数据集,附ResNet-101模型

另外值得一提的是,这已是腾讯开源的第58个项目(https://github.com/Tencent),特别是在加大投入AI等基础技术研究后,鹅厂的回馈和福利也在增多。

作者系网易新闻·网易号“各有态度”签约作者

0 人点赞