最新 最热

毫秒级预测,性能卓越!检测、跟踪、行为识别都搞定!这套行人分析系统重磅开源!

行人检测跟踪计数、人员行为分析、人员属性分析、人员操作及穿戴合规监测等场景化能力在工业、安防、金融、能源等行业有着极其广泛的应用需求。以深度学习视觉技术为核心的行人分析能力,则是以上任务的核心关键,也是近...

2022-04-18
0

何恺明大神新作:一种用于目标检测的主流ViT架构,效果SOTA

3月30日,何恺明大神团队在ArXiv上发布了最新研究工作,该工作主要研究了一种适用于目标检测任务的非层次化结构主流骨干网络ViTDet。该研究表明ViTDet无需重新设计用于预训练的分层主干网络,只对传统的FPN模块最后一个Sta...

2022-04-18
0

CVPR 2022 | 南大提出:Structured Sparse R-CNN:单阶段端到端场景图生成器

本文介绍我们在场景图生成 (Scene Graph Generation, SGG) 领域的工作——Structured Sparse R-CNN for Direct Scene Graph Generation。本工作将端到端稀疏目标检测器引入场景图生成领域,并提出了相应的关系建模组件...

2022-04-18
0

CVPR 2022 | 即插即用!华南理工开源VISTA:双跨视角空间注意力机制实现3D目标检测SOTA

LiDAR (激光雷达)是一种重要的传感器,被广泛用于自动驾驶场景中,以提供物体的精确 3D 信息。因此,基于 LiDAR 的 3D 目标检测引起了广泛关注。许多 3D 目标检测算法通过将无序和不规则的点云进行体素化,随后利用卷积神经...

2022-04-18
1

何恺明团队新作ViTDet:用于目标检测的视觉Transformer主干网络

做目标检测就一定需要 FPN 吗?昨天,来自 Facebook AI Research 的 Yanghao Li、何恺明等研究者在 arXiv 上上传了一篇新论文,证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。他们希望这项...

2022-04-18
0

CVPR 2022 | 即插即用!南洋理工&商汤开源SAM-DETR: 利用语义对齐匹配实现快速收敛的DETR

导读:在CVPR 2022上,新加坡南洋理工大学和商汤研究院的科研团队提出了SAM-DETR —— 利用语义对齐匹配加速DETR检测器收敛。它仅引入一个简单的即插即用的模块,通过采样“目标显著点”的特征使object query和图像特征的...

2022-04-18
0

音视频技术开发周刊 | 241

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。 ✦ 一周简讯 ✦ MPAI-MMC将被IEEE采纳为技术标准 在 MPAI Multimodal Conversation (MPAI-MMC) 获得批准满 6 个月的当天,IEEE 主持了 P...

2022-04-18
0

多尺度深度特征(下):多尺度特征学习才是目标检测精髓(论文免费下载)

计算机视觉研究院专栏 作者:Edison_G 深度特征学习方案将重点从具有细节的具体特征转移到具有语义信息的抽象特征。它通过构建多尺度深度特征学习网络 (MDFN) 不仅考虑单个对象和局部上下文,还考虑它们之间的关系。 公...

2022-04-18
0

人工智能倒逼教育体制改革,课堂需要怎样的AI?丨科技云·视角

德国著名哲学家雅斯贝尔斯这样阐述教育的本质:“教育是用一棵树撼动另一棵树,一朵云推动另一朵云,一颗心灵唤醒另一颗心灵。”但几个世纪以来,教育一直遵循着相同的道路,都是以教师为中心或者走流水线模式。如今,教育行业成...

2022-04-14
1