最新 最热

Scientific Reports|利用强化学习和对接生成分子,开发新抑制剂

今天给大家介绍的是韩国科学技术院的Dongsup Kim等人发表在scientific reports上的论文”Autonomous molecule generation using reinforcement learning and docking to develop potential novel inhib......

2021-03-03
0

TF-char1-简介

自动学习权重的神经元模型-感知机。输出值o和真实值y之间的误差用于调整神经元的权重系数{w_1,w_2,…,w_n}

2021-03-02
1

统计学习方法法导论_1

统计学习的对象是数据data。统计学中的数据通常是以变量或者变量组来表示数据。数据分为连续型和离散型,书中主要讨论的是离散型数据。

2021-03-02
1

【DeepMind】首发并开源Alchemy,一种元强化学习(meta-RL)基准环境。

元学习作为一种增加强化学习的灵活性和样本效率的方法,科研学者对此的关注兴趣迅速增长。然而,该研究领域中的一个问题是缺乏足够的基准测试任务。通常,过去基准的基础结构要么太简单以至于无法引起兴趣,要么就太不明确了...

2021-02-26
1

NeoRL: 接近真实世界的离线强化学习基准

众所周知,强化学习(RL)在游戏界的成功已经在 AI 界产生了轰动 ,不管是玩出历史高分的微软AI,还是继围棋之后,人工智能又攻克的德州扑克,亦或是利用“左右互搏”来增强学习的OpenAI。人工智能在不同的游戏中的最新得分已经超...

2021-02-26
0

李飞飞团队从动物身上get AI新思路,提出RL计算框架,让机器在复杂环境学习和进化

在过去6亿年中,动物在复杂的环境中学习与进化成各异的形态,又利用进化的形态来学习复杂的任务。如此周而复始的学习与进化,造就了动物的认知智慧。...

2021-02-26
0

超级玛丽:强化学习

视频地址测试通关视频: https://live.csdn.net/v/121855深度强化学习深度神经网络提供了丰富的表示形式,可以使强化学习(RL)算法有效执行。Actor Critic简

2021-02-25
1

内卷的世界,我们是否可以换一种思维生活?

由于见识有限,不知道其他行业卷成什么样。这里就以我了解的CV领域卷的程度来做个介绍。

2021-02-24
0

Nature Medicine:经颅交流电刺激可以改善强迫症

强迫症行为在普通人群中非常普遍,对个体造成极大的痛苦。目前对强迫症的治疗结果令人失望,并伴随着副作用。通过非侵入性的神经调节(例如,经颅交流电刺激,tACS),可以进行个性化干预。...

2021-02-24
0

强化学习-策略网络

我一直觉得强化学习是走向强人工智能的一个必经过程,现有的许多问答系统中也时常会出现强化学习的身影。本文使用策略网络玩强化学习入门的平衡杆游戏。...

2021-02-24
0