明敏 发自 凹非寺量子位 | 公众号 QbitAI仅仅需要一个平板电脑,就能实现3D空间的实时重建和理解了!看,只要拿着平板电脑走一走,房间内的物体就能被实时重建、分割和识别出来,整个过程行云流水。要知道,3D重建和语义理解,是机...
---- 新智元报道 编辑:LRS【新智元导读】最近大火的「几何深度学习」到底是怎么出现的?创始人Michael Bronstein发布系列长文,带你从头开始回忆。2016年,牛津大学教授、Twitter的图机器学习研究负责人Michael Bronstei...
前段时间 Transformer已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』、『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』、『Lifting Transformer』、『TimeSformer』等等Transformer为...
什么是多模态?多模态指的是多种模态的信息,包括:文本、图像、视频、音频等。它像人类利用视觉、嗅觉、味觉、听觉等多感官理解现实世界一样,希望充分利用文本、图像、语音和视频等多种模态,这就是「多模态学习」。多模态学...
机器之心专栏作者:王天宇、胡枭玮来自香港中文大学与上海人工智能实验室的王天宇与胡枭玮等作者提出了一种实例阴影检测任务,旨在查找阴影与物体之间的关系。阴影是由光线被物体遮挡而产生,阴影与物体密不可分。为了寻找...
想要将深度学习应用于小型图像数据集,一种常用且非常高效的方法是使用预训练网络。预训练网络(pretrained network)是一个保存好的网络,之前已在大型数据集(通常是大规模图像分类任务)上训练好。如果这个原始数据集足够大且...
【导读】Keras是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。本系列将教你如何从零开始学Keras,从搭建神经网络到项目实...
深度学习中有一个很重要的概念就是卷积神经网络 CNN,卷积神经网络中又有卷积层、池化层的概念。尤其是卷积层,理解难度比较大,虽然书中或者是视频中都有详细介绍过它的基础概念,但对于求知欲望很强烈的我,我总心里痒痒的,...
DCNN(A Convolutional Neural Network for Modelling Sentences)by NalKalchbrenner等,又是文本分类论文的一力作。”准确表达句子的语义是语言理解的核心”,通过学习机器学习和TextCNN,我们可以知道n-gram特征是NLP文本任...