图像识别_字节宝

国科大团队提出首个CNN和Transformer双体基网模型，Conformer准确率高达84.1%！

得益于自注意力机制，Visual Transformer (ViT、Deit)具备了全局、动态感受野的能力，在图像识别任务上取得了更好的结果。

机器学习神经网络深度学习人工智能图像识别

2021-08-25

LeCun在线访谈：我的深度学习之路

近日，深度学习先驱Yann LeCun接受了Gradient Podcast的采访，畅谈了他在80年代早期的AI研究以SSL的最新发展。

https SSL证书图像处理监督学习图像识别

2021-08-25

Transformer 向轻量型迈进！微软与中科院提出两路并行的 Mobile-Former

本文创造性的将MobileNet与Transformer进行了两路并行设计，穿插着全局与特征的双向融合，同时利用卷积与Transformer两者的优势达到“取长补短”的目的。 >>加入极市CV技术交流群，走在计算机视觉的最前沿...

图像识别

2021-08-25

深入浅出Yolo系列之Yolox核心基础完整讲解

在Yolov4、Yolov5刚出来时，大白就写过关于Yolov3、Yolov4、Yolov5的文章，并且做了一些讲解的视频，反响都还不错。

神经网络深度学习人工智能图像识别编程算法

2021-08-25

深入浅出Yolox之自有数据集训练超详细教程

随着旷视科技发布Yolox的论文和代码后，Yolox得到了广泛的关注。但由于训练代码和之前的Yolov3、Yolov4、Yolov5的代码都不相同。且代码中的训练案例，以COCO和VOC格式为基准，和平时大家标注的文件，并不是完全相同的格式。...

神经网络深度学习人工智能图像识别 Python

2021-08-25

PointPillar：利用伪图像高效实现3D目标检测

最近几年点云的三维目标检测一直很火，从早期的PointNet、PointNet++，到体素网格的VoxelNet，后来大家觉得三维卷积过于耗时，又推出了Complex-yolo等模型把点云投影到二维平面，用图像的方法做目标检测，从而加速网络推理。...

图像处理图像识别存储

2021-08-24

清华大学张钹：实现下一代人工智能的两个范式

8月3日，首届全球数字经济大会在京召开。在人工智能产业治理论坛上，来自我国人工智能领域的顶尖科学家，围绕主题“探索创新、共举担当”展开前沿对话。...

神经网络人工智能编程算法图像识别深度学习

2021-08-24

YOLO-FastestV2：更快，更轻！移动端高达300 FPS！参数量仅250k

https://github.com/dog-qiuqiu/Yolo-FastestV2

神经网络深度学习人工智能图像识别 Github

2021-08-24

Transformer 向轻量型迈进！微软与中科院提出两路并行的 Mobile-Former

本文创造性的将MobileNet与Transformer进行了两路并行设计，穿插着全局与特征的双向融合，同时利用卷积与Transformer两者的优势达到“取长补短”的目的。

图像识别

2021-08-24

CVPR2021: Sparse R-CNN新的目标检测模型

今天我们将讨论由四个机构的研究人员提出的一种方法，其中一个是字节跳动人工智能实验室。他们为我们提供了一种新的方法，称为Sparse R-CNN(不要与 Sparse R-CNN 混淆，后者在 3D 计算机视觉任务上使用稀疏卷积)，该方法在...

机器学习神经网络深度学习人工智能图像识别

2021-08-20

87 88 89 90 91

国科大团队提出首个CNN和Transformer双体基网模型，Conformer准确率高达84.1%！

LeCun在线访谈：我的深度学习之路

Transformer 向轻量型迈进！微软与中科院提出两路并行的 Mobile-Former

深入浅出Yolo系列之Yolox核心基础完整讲解

深入浅出Yolox之自有数据集训练超详细教程

PointPillar：利用伪图像高效实现3D目标检测

清华大学张钹：实现下一代人工智能的两个范式

YOLO-FastestV2：更快，更轻！移动端高达300 FPS！参数量仅250k

Transformer 向轻量型迈进！微软与中科院提出两路并行的 Mobile-Former

CVPR2021: Sparse R-CNN新的目标检测模型

热门文章

热门手册