最新 最热

什么是机器学习

利用计算机的运算能力,从大量的数据中发现一个 “函数”或“模型” ,并通过它来模拟现实世界事物间的关系,从而实现预测、判断等目的。建模的过程就是机器“学习”过程。...

2022-09-27
1

Richard Sutton 直言卷积反向传播已经落后,AI 突破要有新思路:持续反向传播

作者 | Richard Sutton编译 | bluemin编辑 | 陈彩娴“可塑性损失”(Loss of Plasticity)是深度神经网络最常被诟病的一个缺点,这也是基于深度学习的 AI 系统被认为无法持续学习的原因之一。对于人脑而言,“可塑性”是指产...

2022-09-27
1

Meta用一个头显搞定全身动捕,无需手柄和下身传感器,网友:VR终于少点物理挂件了

萧箫 发自 凹非寺量子位 | 公众号 QbitAI还记得你玩VR的时候,完全看不到自己下半身的样子吗?毕竟,目前的VR设备通常只有手柄和头显,没有下半身传感器,系统无法直接判断下半身的动作,预测时也容易出bug。现在,Meta终于迈出了...

2022-09-27
1

LeCun:概率论无法实现真正AI,我们要退回原点重新开始

詹士 Pine 发自 凹非寺量子位 | 公众号 QbitAI马库斯又开炮了,直指LeCun最新一篇采访。「LeCun所说的一切,我之前几乎逐字逐句都说过。」「大部分内容就在2018年一篇论文中,而LeCun当时还嘲笑,大部分内容是错误的」。同样...

2022-09-27
1

深度强化学习之模仿学习(Imitation Learning)

大家好,又见面了,我是你们的朋友全栈君。   上一部分研究的是奖励稀疏的情况,本节的问题在于如果连奖励都没有应该怎么办,没有奖励的原因是,一方面在某些任务中很难定量的评价动作的好坏,如自动驾驶,撞死人和撞死动物的奖...

2022-09-27
1

LeCun再炮轰Marcus: 他是心理学家,不是搞AI的

---- 新智元报道  编辑:David Aeneas【新智元导读】最近,LeCun在采访中犀利点评了两位老对手:Marcus是个心理学家,不是搞AI的;Schmidhuber是个插旗的。最近,LeCun接受了ZDNet的采访,表示当今的大多数人工智能方法永远不会...

2022-09-27
0

【新书推荐】《强化学习的数学原理》-高效透彻地理解强化学习算法

强化学习是数学和应用的优美结合。如果我们从数学的角度去看待很多问题,能够更加透彻的理解强化学习中的很多问题。不过目前许多学习资料都尽可能避免介绍其中的数学原理,因为过多的数学可能会让不少读者望而生畏。...

2022-09-23
0

【万字专栏总结】离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等)

强化学习发展的特别早,但一直不温不火,其中Sutton老爷子早在1998年就写了强化学习领域的圣经书籍:An Introduction : Reinforcement Learning ,但也并未开启强化学习发展的新局面。直到2012年,深度学习广泛兴起,大规模的神...

2022-09-23
1

【经验】深度强化学习训练与调参技巧

来源:知乎(https://zhuanlan.zhihu.com/p/482656367)

2022-09-23
0

【47页综述】牛津大学联合7家单位发布AutoRL综述,还在手动调参吗?你已经落后了

强化学习 (RL) 与深度学习的结合带来了一系列令人印象深刻的壮举,许多人认为(深度)强化学习提供了通向通用智能体的途径。然而,RL 智能体的成功通常对训练过程中的设计选择高度敏感,这可能需要繁琐且容易出错的手动调整。...

2022-09-23
0