最新 最热

【Nature重磅】OpenAI科学家提出全新强化学习算法,推动AI向智能体进化

近年来,人工智能(AI)在强化学习算法的加持下,取得了令人瞩目的成就。比如在围棋、星际争霸 II 和 Dota 2 等诸多策略、竞技类游戏中,AI 都有着世界冠军级的表现,以及在机器人跑步、跳跃和抓握等技能的自主学习方面,也起到了...

2021-03-17
0

1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?

机器之心发布机器之心编辑部机器之心《2020-2021 全球 AI 技术趋势发展报告》节选:顶会趋势(NeurIPS)分析。2021 年 1 月,机器之心发布《2020-2021 全球 AI 技术趋势发展报告》,基于顶会、论文及专利等公共数据、机器之心...

2021-03-15
0

设计简单有效的强化学习探索算法,快手有新思路

探索是强化学习的经典问题,一个好的探索策略可以极大地提高强化学习的效率,节省计算资源。

2021-03-15
0

AutoML大提速,谷歌开源自动化寻找最优ML模型新平台Model Search

神经网络的成功通常取决于在多种任务上的泛化性能。然而,设计此类神经网络很有难度,因为研究社区对神经网络如何泛化仍没有充分的了解:对于给定问题,什么样的神经网络是适合的?深度如何?应该使用哪种层?LSTM 层就可以了,还是...

2021-03-15
1

如何缩小离线强化学习基准与现实的差距?南栖仙策提出接近真实世界的新基准NewRL

2016 年,AlphaGo 以 4:1 的绝对优势击败世界顶级围棋大师李世石,将强化学习带入大众视野。此后,该领域成果频出,如 AlphaGo 的进阶版 AlphaGo Zero、AlphaZero 等。然而,将强化学习部署到现实世界还存在着许多挑战。...

2021-03-15
0

深度学习求解魔方新方法!诺丁汉大学研究团队提出适应度函数

人工智能和人类之间的“竞赛”一直都是热门的研究话题,AlphaGo 战胜了人类围棋玩家,AlphaZero 在围棋比赛中击败了AlphaGo 及其更高版本,并在国际象棋比赛中击败了顶级象棋引擎之一 Stockfish。在 DOTA2 多人实时战略游...

2021-03-12
1

深入浅出解读并思考AlphaGo

;其次我们要想一下我们下了某一步之后局面会怎么变化,对方会怎么下,我们又怎么接着对方的棋往下下,我们把这种思考叫做思考的深度

2021-03-11
1

机器学习在组合优化中的应用(上)

运筹学自二战诞生以来,现已被广泛应用于工业生产领域了,比如交通运输、供应链、能源、经济以及生产调度等。离散优化问题(discrete optimization problems)是运筹学中非常重要的一部分,他们通常可以建模成整数优化模型进行...

2021-03-04
1

journal-20-8

notability就相当于A4纸。可以放装订好的ppt,也可以是打印的电子书,也可以拿来当草稿纸。

2021-03-04
0

IEEE|具有混合状态的强化分子生成

今天给大家介绍的是悉尼大学的Fangzhou Shi等人在2019年IEEE上发表的会议论文“Reinforced Molecule Generation with Heterogeneous States”。近年来,基于强化学习的方法利用图来表示并生成分子。然而,分子图表示可能...

2021-03-03
0