Action_字节宝

Q-learning 的本质是在干什么？

Q-learning 是要让 agent 通过不断地玩游戏，从环境给予的奖励反馈中学习到给定state下的最优 action。

action agent probability state

2020-03-20

自动驾驶器环境介绍

在gym里有个自动驾驶的模拟器，它的任务是把乘客从一个地方接起，在另一个地方放下，在这个过程中需要小车至少遵守下面三个规则：

action state

2020-03-20

Q-learning 的 python 实现

通过前面的几篇文章可以知道，当我们要用 Q-learning 解决一个问题时，首先需要知道这个问题有多少个 state，每个 state 有多少 action，并且建立一个奖励表格 P，维度是 action * 4，这4列分别标记着采取每个 action 的概率，采取...

action agent function state table

2020-03-20

Gym 的 Frozen Lake 环境介绍

上一篇文章有介绍gym里面env的基本用法，下面几行可以打印出一个当前环境的可视化：

action agent render sample state

2020-03-20

结构化思维学习笔记

结果 - 原因提炼重点思考过程：要素分类 >>> 最终结果 >>> 关键要素

action

2020-03-20

游戏设计模式——Unity事件队列（纪念京阿尼事件）

在游戏开发过程中，经常会出现不同板块之间的信息交流，或是存在“当...,就...”的情况，事件队列编程模式可以有效解决消息传递中产生的脚本耦合问题，让同一个板块的脚本更加单纯，不包含其他脚本的杂质内容，使脚本更容易最大...

action event

2020-03-19

[视频剪辑]13种剪辑手法

https://www.bilibili.com/video/av34927726

action cut fade match

2020-02-25

我和Double Lift的故事（四）——实战篇

在上一篇中，我们借Double Lift手法，介绍了如何从一个基本手法变成一个魔术表演的过程。其核心就是魔术效果的制造与呈现的分离，在后来我与郭玉文老师的探讨中，他说，这也叫“声东击西，顺手牵羊”。在手法的基础上，以及上一篇...

action double hook lift

2020-02-17

面试官：优化代码中大量的if/else，你有什么方案?

一个快速迭代的项目，时间久了之后，代码中可能会充斥着大量的if/else，嵌套6、7层，一个函数几百行，简！直！看！死！人！

action google jdk8 map return

2020-02-12

python argparse(参数解析

# 创建argparse对象，并将产品简要说明加入show = '程序说明' ===>程序简要说明(字符串)，输出help时会显示p = argparse.ArgumentParser(description=show)

action add argparse default store

2020-01-17

22 23 24 25 26

Q-learning 的本质是在干什么？

自动驾驶器环境介绍

Q-learning 的 python 实现

Gym 的 Frozen Lake 环境介绍

结构化思维学习笔记

游戏设计模式——Unity事件队列（纪念京阿尼事件）

[视频剪辑]13种剪辑手法

我和Double Lift的故事（四）——实战篇

面试官：优化代码中大量的if/else，你有什么方案?

python argparse(参数解析

热门文章

热门手册