前言
本篇博客大概会记录强化学习RL的基础知识,基本方法,以及如何推导到DQN,和关于DeepMind的Playing Atari with Deep Reinforcement Learning(DQN学习打砖块游戏)这篇论文的一些理解,后续改进方向,还有一些具体实现。若有理解不当,恳请指出!
强化学习基础
强化学习中两大最基本的要素:Agent(智能体)与Environment(环境)。 在每个时间
内:
- Agent需要 1.做出行动
2. 观察环境
计算收益
本篇博客大概会记录强化学习RL的基础知识,基本方法,以及如何推导到DQN,和关于DeepMind的Playing Atari with Deep Reinforcement Learning(DQN学习打砖块游戏)这篇论文的一些理解,后续改进方向,还有一些具体实现。若有理解不当,恳请指出!
强化学习中两大最基本的要素:Agent(智能体)与Environment(环境)。 在每个时间
内:
2. 观察环境
计算收益