图像识别_字节宝

首页 / 技术

目标检测 | 常用数据集标注格式及生成脚本

目标检测是计算机视觉任务中的一个重要研究方向，其用于解决对数码图像中特定种类的可视目标实例的检测问题。目标检测作为计算机视觉的根本性问题之一，是其他诸多计算机视觉任务，例如图像描述生成，实例分割和目标跟踪的基...

神经网络深度学习人工智能图像识别 xml

2021-12-14

0

全新范式 | Box-Attention同时让2D、3D目标检测、实例分割轻松涨点（求新必看）

对于目标检测、实例分割、图像分类和许多其他当前的计算机视觉挑战，一个带有Multi-Head Self-Attention的Transformer可能是所有任务都需要的。Transformer在自然语言处理中取得成功后，学习远程特征依赖在计算机视觉中...

图像识别图像处理

2021-12-13

0

字节&约翰斯·霍普金斯&上交提出iBOT框架，基于MIM进行自监督训练，在ImageNet-1K上达到86.3%的微调精度！

语言Transformer的成功主要归功于masked language modeling（MLM）的预训练任务，其中文本首先被标记为语义上有意义的片段。在这项工作中，作者研究了masked image modeling（MIM），并指出了使用语义上有意义的视觉标记器（visual...

2021-12-13

0

小模型实现大一统！Meta RL华人一作FBNetV5一举包揽CV任务3个SOTA

神经网络模型经常被研究人员戏称为「堆积木」，通过将各个基础模型堆成更大的模型，更多的数据来取得更好的效果。

图像识别 HTML

2021-12-10

0

【3D目标检测】开源 | 一种新型的探测遥远物体的融合策略，在鸟瞰图和3D中远距目标检测方面的性能SOTA！

论文地址： http://arxiv.org/pdf/2011.01404v3.pdf

图像处理图像识别

2021-12-10

0

全面超越Swin Transformer | Facebook用ResNet思想升级MViT

为不同的视觉识别任务设计架构一直以来都很困难，而采用最广泛的架构是那些结合了简单和高效的架构，例如VGGNet和ResNet。最近，Vision Transformers(ViT)已经展现出了有前途的性能，并可以与卷积神经网络竞争，最近也有很多研...

2021-12-09

0

用安卓手机解锁目标检测模型YOLOv5，识别速度不过几十毫秒！

YOLOv5于2020年5月发布，最大的特点就是模型小，速度快，所以能很好的应用在移动端。

深度学习神经网络人工智能图像识别容器

2021-12-09

0

python opencv-有点意思同学讨论问题记录

还有很多，懒得发了，通过讨论，问题基本上都已经解决了，本来懒得写了，觉得太花时间了，想了想决定还是写吧，别问为啥，问就是热爱编程，乐于助人。...

2021-12-08

0

小模型实现大一统！Meta RL华人一作FBNetV5一举包揽CV任务3个SOTA

【新智元导读】Meta现实实验室（Meta Reality Lab）华人一作提出FBNetV5，这是一种在一次运行中同时为多个任务搜索架构的神经架构搜索（NAS）算法。针对三个基本的视觉任务：图像分类、物体检测和语义分割，FBNetV5搜索到的模型在...

图像识别 HTML

2021-12-08

0

[Extensive Reading]目标检测(object detection)系列（十六）YOLOv4：平衡速度与精度

YOLOv4是YOLO之父Joseph Redmon宣布退出计算机视觉的研究之后推出的YOLO系列算法，其作者Alexey Bochkovskiy也参与了YOLO之前系列算法，《YOLOV4: Optimal Speed and Accuracy of Object Detection》，其主要贡献在于对近...

图像识别神经网络深度学习人工智能机器学习

2021-12-07

0

77 78 79 80 81