最新 最热

国科大团队提出首个CNN和Transformer双体基网模型,Conformer准确率高达84.1%!

得益于自注意力机制,Visual Transformer (ViT、Deit)具备了全局、动态感受野的能力,在图像识别任务上取得了更好的结果。

2021-08-25
0

LeCun在线访谈:我的深度学习之路

近日,深度学习先驱Yann LeCun接受了Gradient Podcast的采访,畅谈了他在80年代早期的AI研究以SSL的最新发展。

2021-08-25
1

Transformer 向轻量型迈进!微软与中科院提出两路并行的 Mobile-Former

本文创造性的将MobileNet与Transformer进行了两路并行设计,穿插着全局与特征的双向融合,同时利用卷积与Transformer两者的优势达到“取长补短”的目的。 >>加入极市CV技术交流群,走在计算机视觉的最前沿...

2021-08-25
0

深入浅出Yolo系列之Yolox核心基础完整讲解

在Yolov4、Yolov5刚出来时,大白就写过关于Yolov3、Yolov4、Yolov5的文章,并且做了一些讲解的视频,反响都还不错。

2021-08-25
0

深入浅出Yolox之自有数据集训练超详细教程

随着旷视科技发布Yolox的论文和代码后,Yolox得到了广泛的关注。但由于训练代码和之前的Yolov3、Yolov4、Yolov5的代码都不相同。且代码中的训练案例,以COCO和VOC格式为基准,和平时大家标注的文件,并不是完全相同的格式。...

2021-08-25
0

PointPillar:利用伪图像高效实现3D目标检测

最近几年点云的三维目标检测一直很火,从早期的PointNet、PointNet++,到体素网格的VoxelNet,后来大家觉得三维卷积过于耗时,又推出了Complex-yolo等模型把点云投影到二维平面,用图像的方法做目标检测,从而加速网络推理。...

2021-08-24
0

清华大学张钹:实现下一代人工智能的两个范式

8月3日,首届全球数字经济大会在京召开。在人工智能产业治理论坛上,来自我国人工智能领域的顶尖科学家,围绕主题“探索创新、共举担当”展开前沿对话。...

2021-08-24
0

Transformer 向轻量型迈进!微软与中科院提出两路并行的 Mobile-Former

本文创造性的将MobileNet与Transformer进行了两路并行设计,穿插着全局与特征的双向融合,同时利用卷积与Transformer两者的优势达到“取长补短”的目的。

2021-08-24
0

CVPR2021: Sparse R-CNN新的目标检测模型

今天我们将讨论由四个机构的研究人员提出的一种方法,其中一个是字节跳动人工智能实验室。他们为我们提供了一种新的方法,称为Sparse R-CNN(不要与 Sparse R-CNN 混淆,后者在 3D 计算机视觉任务上使用稀疏卷积),该方法在...

2021-08-20
0