最新 最热

Q-learning 的本质是在干什么?

Q-learning 是要让 agent 通过不断地玩游戏,从环境给予的奖励反馈中学习到给定state下的最优 action。

2020-03-20
1

自动驾驶器环境介绍

在gym里有个自动驾驶的模拟器,它的任务是把乘客从一个地方接起,在另一个地方放下,在这个过程中 需要小车至少遵守下面三个规则:

2020-03-20
1

Q-learning 的 python 实现

通过前面的几篇文章可以知道,当我们要用 Q-learning 解决一个问题时,首先需要知道这个问题有多少个 state,每个 state 有多少 action,并且建立一个奖励表格 P,维度是 action * 4,这4列分别标记着采取每个 action 的概率,采取...

2020-03-20
1

Gym 的 Frozen Lake 环境介绍

上一篇文章有介绍gym里面env的基本用法,下面几行可以打印出一个当前环境的可视化:

2020-03-20
1

结构化思维学习笔记

结果 - 原因 提炼重点 思考过程:要素分类 >>> 最终结果 >>> 关键要素

2020-03-20
1

游戏设计模式——Unity事件队列(纪念京阿尼事件)

在游戏开发过程中,经常会出现不同板块之间的信息交流,或是存在“当...,就...”的情况,事件队列编程模式可以有效解决消息传递中产生的脚本耦合问题,让同一个板块的脚本更加单纯,不包含其他脚本的杂质内容,使脚本更容易最大...

2020-03-19
1

[视频剪辑]13种剪辑手法

https://www.bilibili.com/video/av34927726

2020-02-25
1

我和Double Lift的故事(四)——实战篇

在上一篇中,我们借Double Lift手法,介绍了如何从一个基本手法变成一个魔术表演的过程。其核心就是魔术效果的制造与呈现的分离,在后来我与郭玉文老师的探讨中,他说,这也叫“声东击西,顺手牵羊”。在手法的基础上,以及上一篇...

2020-02-17
1

面试官:优化代码中大量的if/else,你有什么方案?

一个快速迭代的项目,时间久了之后,代码中可能会充斥着大量的if/else,嵌套6、7层,一个函数几百行,简!直!看!死!人!

2020-02-12
1

python argparse(参数解析

# 创建argparse对象,并将产品简要说明加入show = '程序说明' ===>程序简要说明(字符串),输出help时会显示p = argparse.ArgumentParser(description=show)

2020-01-17
1