最新 最热

一文梳理联邦学习推荐系统研究进展

推荐系统,对于我们来说并不陌生,它已经无时无刻不方便着我们的生活、学习、工作等方方面面,并且已经成为许多社交/购物/新闻平台中必不可少的组件。近些年来学术界以及工业界的研究者们已经对其进行了大量研究并提出了许...

2021-09-23
1

最新基于强化学习的推荐系统综述

链接 | mp.weixin.qq.com/s/yOcWMmqddQPyEa2oROCzxQ

2021-09-23
1

Java调用含第三方库Python脚本传递数据并返回计算结果

目前有几种Java调用Python的方法,不过能良好兼容Python第三方库的方法通常是使用

2021-09-18
0

【论文阅读】DeepJS: Job Scheduling Based on DRL in Cloud Data Center

作者提出一种在矢量装箱问题下的,基于深度强化学习的,资源调度算法(原文称作业调度),该算法可自动获得合适的计算方法,该方法将最小化完成时间(最大化吞吐量),本文从trace-driven的仿真演示了DeepJS的收敛和泛化性以及DeepJS学...

2021-09-18
0

深度强化学习框架Ray|RLLib|Tune学习笔记

通过拿到远程函数的ID,可以在集群的任何地方,通过get(ID)获取该函数返回值

2021-09-18
1

Gym平台在强化学习实验中的应用

原文出处:https://zhuanlan.zhihu.com/p/114392519.知乎

2021-09-18
1

北大教授用《星际争霸II》玩警察抓小偷? 对抗性代理强化学习模型教AI如何逃跑!

作为一款极为经典的即时战略游戏,暴雪开发的《星际争霸II》也是强化学习训练最喜爱的训练环境之一。

2021-09-17
0

机器人相关学术速递[9.10]

【1】 Leveraging Local Domains for Image-to-Image Translation标题:利用本地域进行图像到图像的转换链接:https://arxiv.org/abs/2109.04468

2021-09-16
0

FAIR 训练 AI 玩拳击,效果堪比真人比赛,试探+周旋+爆头

基于 AI 深度强化学习的拳击选手身体不仅拥有超高自由度,而且它还掌握了格挡、后退、摆拳等拳击基本动作。

2021-09-16
0

机器学习学术速递[9.2]

【1】 Position-based Hash Embeddings For Scaling Graph Neural Networks标题:基于位置的标度图神经网络散列嵌入算法链接:https://arxiv.org/abs/2109.00101

2021-09-16
1