最新 最热

目标检测 | 常用数据集标注格式及生成脚本

目标检测是计算机视觉任务中的一个重要研究方向,其用于解决对数码图像中特定种类的可视目标实例的检测问题。目标检测作为计算机视觉的根本性问题之一,是其他诸多计算机视觉任务,例如图像描述生成,实例分割和目标跟踪的基...

2021-12-14
0

全新范式 | Box-Attention同时让2D、3D目标检测、实例分割轻松涨点(求新必看)

对于目标检测、实例分割、图像分类和许多其他当前的计算机视觉挑战,一个带有Multi-Head Self-Attention的Transformer可能是所有任务都需要的。Transformer在自然语言处理中取得成功后,学习远程特征依赖在计算机视觉中...

2021-12-13
0

字节&约翰斯·霍普金斯&上交提出iBOT框架,基于MIM进行自监督训练,在ImageNet-1K上达到86.3%的微调精度!

语言Transformer的成功主要归功于masked language modeling(MLM) 的预训练任务,其中文本首先被标记为语义上有意义的片段。在这项工作中,作者研究了masked image modeling(MIM) ,并指出了使用语义上有意义的视觉标记器(visual...

2021-12-13
0

小模型实现大一统!Meta RL华人一作FBNetV5一举包揽CV任务3个SOTA

神经网络模型经常被研究人员戏称为「堆积木」,通过将各个基础模型堆成更大的模型,更多的数据来取得更好的效果。

2021-12-10
0

全面超越Swin Transformer | Facebook用ResNet思想升级MViT

为不同的视觉识别任务设计架构一直以来都很困难,而采用最广泛的架构是那些结合了简单和高效的架构,例如VGGNet和ResNet。最近,Vision Transformers(ViT)已经展现出了有前途的性能,并可以与卷积神经网络竞争,最近也有很多研...

2021-12-09
0

用安卓手机解锁目标检测模型YOLOv5,识别速度不过几十毫秒!

YOLOv5于2020年5月发布,最大的特点就是模型小,速度快,所以能很好的应用在移动端。

2021-12-09
0

python opencv-有点意思同学讨论问题记录

还有很多,懒得发了,通过讨论,问题基本上都已经解决了,本来懒得写了,觉得太花时间了,想了想决定还是写吧,别问为啥,问就是热爱编程,乐于助人。...

2021-12-08
0

小模型实现大一统!Meta RL华人一作FBNetV5一举包揽CV任务3个SOTA

【新智元导读】Meta现实实验室(Meta Reality Lab)华人一作提出FBNetV5,这是一种在一次运行中同时为多个任务搜索架构的神经架构搜索(NAS)算法。针对三个基本的视觉任务:图像分类、物体检测和语义分割,FBNetV5搜索到的模型在...

2021-12-08
0

[Extensive Reading]目标检测(object detection)系列(十六)YOLOv4:平衡速度与精度

YOLOv4是YOLO之父Joseph Redmon宣布退出计算机视觉的研究之后推出的YOLO系列算法,其作者Alexey Bochkovskiy也参与了YOLO之前系列算法,《YOLOV4: Optimal Speed and Accuracy of Object Detection》,其主要贡献在于对近...

2021-12-07
0