这次带队参加了ICCV2021的UVO(Unidentified Video Objects) Challenge,本次比赛共有两个赛道,分别为基于图片的开放世界实例分割和基于视频的开放世界实例分割。我们运气不错,拿下了本次比赛两个赛道的冠军。以下为本次...
目标检测的应用场景很广泛,我们也用得比较多,从检测公司logo,到合同文档的页眉页脚,到楼道里的消防设备等,趁着周末就总结一下。
关于yolov3,大家可以看这里:https://github.com/pjreddie/darknet
在CV领域,CNN一直是各个技术方向最主流的算法,卷积由于其具有局部连接和权重共享的特性,取得了很好的效果。随着Transformer技术在自然语言处理领域取得了丰硕的成果,CV领域也开始尝试将Transformer 技术用于处理图像和视...
图灵奖大佬 Geoffrey Hinton 的团队和 Google Brain 团队近日发布新工作 Pix2seq,将 CV 经典任务 目标检测 转换为了语言模型的下游任务。
前言 本文介绍了知乎上关于视频目标检测与图像目标检测的区别的几位大佬的回答。主要内容包括有视频目标检测与图像目标检测的区别、视频目标检测的研究进展、研究思路和方法。...
tensorRT,nvidia发布的dnn推理引擎,是针对nvidia系列硬件进行优化加速,实现最大程度的利用GPU资源,提升推理性能
Vision transformers已成为计算机视觉任务的重要模型之一。虽然它们优于早期的卷积网络,但使用传统的自注意力算法时,其复杂度是
基于角点的目标检测方法通过组合从特征图中学习到的角点对来预测边框。这种方法不需要设计锚框, 减少了对锚框的各种计算, 从而成为生成高质量边框的更有效的方法。 基于角点Anchor-Free 目标检测模型主要有 Corne...
基于全卷积网络的主流目标检测器已经取得了很好的表现。然而大多数检测器仍旧需要一个手动设计的NMS后处理流程,阻碍了端到端的训练。