最新 最热

独家算力支持|腾讯“开悟”AI大赛启动

8月18日,第二届 “腾讯开悟 MOBA 多智能体强化学习大赛”(下称“大赛”)宣布启动。该大赛由腾讯 AI Lab、王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起,由腾讯云计算提供底层资源支持。 “开悟” AI 开放研究平台依托...

2021-08-19
0

第二届腾讯“开悟”AI大赛启动,联动高校破局研究瓶颈

8月18日,第二届 “腾讯开悟MOBA多智能体强化学习大赛”(下称“大赛”)宣布启动。该大赛由腾讯AI Lab、王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起,由腾讯云计算提供底层资源支持。 “开悟”AI开放研究平台依托于腾...

2021-08-19
0

AlphaGo是如何炼成的:解读论文 "Mastering the game of Go with deep neural networks and tree search"

这篇发表在nature 2016年1月27日上的文章题目为:"Mastering the game of Go with deep neural networks and tree search"来自Google deep mind,它阐述了AlphaGo的模型过程和训练方法,让我们对这篇论文进行解读,看看为何A...

2021-08-18
1

CoppeliaSim结合Gym构建强化学习环境

本文将介绍CoppeliaSim与Gym框架结合来构建强化学习环境的基本方法,通过一个强化学习的经典控制例子cartpole来讲述如何在Gym的框架下,构建基于CoppeliaSim的强化学习仿真环境,如何使用visdom来实时查看训练的过程,以及使...

2021-08-13
0

基于目标导向行为和空间拓扑记忆的视觉导航方法

动物,包括人类在内,在空间认知和行动规划方面具有非凡的能力,与其对应的导航行为也在心理学和神经科学中得到广泛研究.1948年, Tolman提出“认知地图(cognitivemap)”概念用于说明物理环境的内在表达,自此,认知地图的存在和...

2021-08-13
1

震惊了,用Python这么简单实现了聊天系统的脏话,广告检测

在游戏中聊天功能几乎是必备的功能,这样的功能存在一定的问题那就是会导致世界频道很乱,经常会有一些敏感词,或者一些游戏厂商不愿意看到的聊天,之前我们游戏中也有这样的问题,我们公司做了举报和后台监控,今天就来实现下这...

2021-08-10
1

【Mava】一个分布式多智能体强化学习研究框架

Mava 是一个用于构建多智能体强化学习 (MARL) 系统的库。Mava 为 MARL 提供了有用的组件、抽象、实用程序和工具,并允许对多进程系统训练和执行进行简单的扩展,同时提供高度的灵活性和可组合性。...

2021-08-10
0

如何食用《机器学习》?

如果你没有学过机器学习的话,可能你并不能看懂这几张图,哎哎哎,别丢砖头鸡蛋啊…………

2021-08-09
1

一个求解零和博弈的通用框架:让人工智能自己发现算法

「机器之心走近全球顶尖实验室:UCL多智能体强化学习研究团队」系列直播今晚第四期,来自UCL汪军教授团队的杨耀东博士将带来分享:Dealing with Non-transitivity in Two-player Zero-sum Games。...

2021-08-06
0