最新 最热

∇SLAM:自动可微分SLAM

将表示学习方法与同时定位和建图(SLAM)系统相结合是一个开放的问题,因为它们的高度模块化和复杂性.在功能上,SLAM是一种将原始传感器输入转换成机器人和环境状态分布的操作.如果这种转换(SLAM)可以表达为一个可微函数...

2021-01-06
0

腾讯AI Lab绝悟团队夺冠Kaggle足球AI竞赛

Google Research 与英超曼城俱乐部在 Kaggle 平台上联合举办的 11v11 足球 AI 竞赛 Google Football 近日宣布最终结果:腾讯 AI Lab 绝悟 WeKick 版本(下称绝悟)以 1785.8 的分数获得冠军,且相比于其它队伍优势非常明显。...

2021-01-05
0

【论文复现】一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

熟悉强化学习Gym环境的小伙伴应该对 (BWH-v2环境) BipedalWalkerHardcore-v2(如图1)并不陌生。在这个环境里,这个Agent需要与Environment互动并学会在不同路况下奔跑行走。由于这个环境是的动作空间是4维连续动作空间,同...

2021-01-04
0

强化学习之不基于模型的控制(五)

-贪婪策略)被提出,其基本思想就是使得某一状态下所有可能的行为都有几率被选中执行,具体通过设置一个比较小的

2021-01-04
0

前瞻 | 使用机器学习方法检测和估计全球降雪

发表于Earth and Space Science的一项新研究运用机器学习方法,基于卫星被动式微波探测仪观测数据,并通过高质量的星载雷达提供的降雪数据进行训练,来获取全球降雪的发生和速率。...

2020-12-18
0

7 Papers & Radios | NeurIPS 2020最佳论文;全卷积网络实现E2E目标检测

论文 1:No-Regret Learning Dynamics for Extensive-Form Correlated Equilibrium

2020-12-17
0

强化学习之蒙特卡洛学习,时序差分学习理论与实战(四)

的一个状态序列信息可以表示为如下的一个序列(即在初始状态执行某动作,获得离开该状态的即时奖励,到达下一个状态

2020-12-15
0

李飞飞团队最新论文:基于anchor关键点的类别级物体6D位姿跟踪

作者提出了一种基于RGB-D的深度学习方法6PACK,能够实时的跟踪已知类别物体。通过学习用少量的3D关键点来简洁地表示一个物体,基于这些关键点,通过关键点匹配来估计物体在帧与帧之间的运动。这些关键点使用无监督端到端学...

2020-12-11
0

基于深度学习的三维重建算法综述

目前,三维重建技术已在游戏、电影、测绘、定位、导航、自动驾驶、VR/AR、工业制造以及消费品领域等方面得到了广泛的应用。方法同样也层出不穷,我们将这些方法依据原理分为两类:...

2020-12-11
0