最新 最热

Deep Q-Learning 简介:一起玩 Doom

上一次,我们了解了 Q-Learning:一种生成 Q-table 的算法,代理使用它来找到在给定状态下采取的最佳动作。

2021-06-11
0

KDD2019 | 强化学习优化推荐系统长期收益

强化学习在训练agent时,优化的目标是最大化决策所能带来的长期奖励。传统的基于监督学习的推荐系统往往不考虑长期奖励,而是仅考虑短期的收益(例如此刻推荐什么物品点击率最高,或者本日推荐什么转化率最高)。因此,如果可...

2021-06-10
1

近年来强化学习分类综述大全,不看后悔,收藏为先!

A survey of benchmarking frameworks for reinforcement learning

2021-06-09
1

论文拾萃|基于深度强化学习的组合优化研究进展

李凯文,张涛,王锐*,覃伟健,黄鸿,贺惠辉,基于深度强化学习的组合优化研究进展,自动化学报,2020, 41(x): 1−17 doi: 10.16383/j.aas.c200551

2021-06-09
0

摄像头、雷达、地图都不用,双足机器人走路全靠「我觉得」

双足机器人昂贵、复杂且易碎。单从平衡性来看,双脚站立和行走要比四足难得多,但由于双足机器人更像人,仍然有许多研究者致力于研发双足机器人。...

2021-06-08
0

运维大佬嘲笑我,这个你都不知道?

起因是:前几年我在老家郑州实习面试(那个时候还没有毕业)的时候遇到面试官提问;面试官来于百度总部的工程师6年java开发经验+3年多的PHP开发经验,我在他的面前基本就是弟弟中的弟弟,虽然勉强通过入职了,但是却被运维无情地...

2021-06-03
0

[万字综述] 21年最新最全Graph Learning算法,建议收藏慢慢看

今天小编给大家带来了一篇极全的2021最新图学习算法综述。该综述不仅囊括了目前热门的基于深度学习的图学习方法,还全面介绍了其它三个大类:基于图信号处理的方法、基于矩阵分解的方法、基于随机游走的方法。因此能带领...

2021-05-31
1

逆袭大厂生存指南-1 初出茅庐

最近偶然间跟同事一起吃饭聊起了自己做程序员的感受;同事大都是八年左右经验的互联网缔造者;听着他们说起自己一路走来的往事,仿佛在我眼前;仿佛他们最终所说的那个少年就是我。真的,因为我也是曾经那个不学无术的少年;也是...

2021-05-28
1

面试系列-2 redis列表场景分析实践

上一章节面试官问了我们关于string数据结构的使用场景以及注意的点。虽然我们对答如流,但是毕竟只是redis很基础的知识点,下面面试官即将开始新的一轮面试要点,注重考查我们的日常工作中使用的场景以及怎样解决出现的弊...

2021-05-28
0

AutoML入侵强化学习!Google用「元学习」来强化学习,ICLR2021已接收

近年来,AutoML在自动化机器学习的设计方面已经取得了巨大的成功,例如设计神经网络体系结构和模型更新规则。

2021-05-27
0