CVPR2020数据集
CVPR2020上开源的十个最有用的数据集,用数据来构建更好的人工智能,数据搬运工从来不应该缺席!下面就是十个数据集的分别解释:
01
FaceScape
一个大规模高质量的3D人脸数据集,包括18760站高质量3D人脸模型,对938名自愿者实现20种表情采集,该数据训练可以实现对单张图像预测3D人脸的细节。适应于非商业开源项目。数据集下载地址:
代码语言:javascript复制https://facescape.nju.edu.cn/
02
OASIS
全称是开放的单图表面标注,是大规模的单图三维表面数据集。该数据集采用了14万张的互联网图像,人工标注实现了三维表面像素级重建。该数据集可以在深度估算、三维表面重建、边缘检测、实例分割等方向上帮助研究者。
代码语言:javascript复制https://oasis.cs.princeton.edu/
03
Waymo开放数据集
来自谷歌母公司旗下Waymo开源的大规模、高质量、自动驾驶数据集。该数据包含大量高质量手动标注的3D与2D图像,包含了1150个场景,涵盖雷达与相机导航数据,城市与乡村道路。数据集下载地址:
代码语言:javascript复制https://waymo.com/open
04
landmarks数据集
来自Google Landmarks Dataset v2,一个大规模的自然地标图像检索与识别基准数据集。采集了20W的500W的数据。下载地址如下:
代码语言:javascript复制https://github.com/cvdfoundation/google-landmark
05
FineGym
基于细粒度动作理解的层次化视频数据集,主要为了动作识别领域的研究需要,由港中大开发的大规模、高质量的动作细粒度识别数据集。数据集在动作和子动作两个层次上实现标注,具有三个层次的语义,具有多个不同层次的语义。下载地址如下:
https://sdolivia.github.io/FineGym/
06
DeeperForensics
一个大规模的人脸伪造检测数据集,是目前为止最大的人脸伪造检测基准数据集,有60000个视频,总共有1760万帧真实世界的人脸,是当期其它同类数据集的十倍。下载地址如下:
代码语言:javascript复制https://github.com/EndlessSora/DeeperForensics-1.0/blob/master/README.md
07
HUMBI
一个新的大规模多视角人体表达数据集,包含多个视角的自然衣着状态下的人体表达,这个数据集的主要目的是帮助更加有效的学习与重建人体,它是MPII-Gaze, Multi-PIE, Human3.6M, and Panoptic Studio datasets这些数据集的补充。
08
COCAS
这个是一个最有意思的数据集,都知道行人RID的场景中,换了衣服很多算法都会扑街,这个方向的研究其实一直在进行,该数据集就是一个大规模的换衣行人再识别的数据集。提供了针对每个人多张不同衣着的照片。总结5266人的62382张身体图像,每个人有5∼25幅图像和2∼3种不同衣着。
09
VIOLIN
视频与语言推理,一个新的大规模数据集,总计15887个视频片段包含95322个视频假设对,超过582个小时的视频,这些视频内容丰富,时间跨度大。主要来自流行的电视剧、电影剪切片断、油管。下载地址:
代码语言:javascript复制https://github.com/jimmy646/violin
10
nuScenes
自动驾驶多模式数据集,针对多个自动驾驶场景下第一个拥有全自动驾驶传感器的数据集,包含六个相机、五部雷达与一部激光雷达,而且是360全景视图。用过1000个场景,每个场景8秒长的视频,包含标注的23类对象与8个属性类别的3D轮廓,比KITTI 数据集多七倍的标注信息与100倍的图像数据,拥有最大规模的3D标注框数据。下载地址:
代码语言:javascript复制https://www.nuscenes.org/