读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
理性和公共知识
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
纯策略中的优势(dominance)
- 数学表达: 除了玩家i以外所有玩家的策略集合
[ S equiv S_1 times S_2 times cdots S_n \ S_{-i} equiv S_1 times S_2 times cdots times S_{i-1} times S_{i 1} times cdots S_n \ s = (s_1, s_2, cdots, s_n) \ s_{-i} = (s_1, s_2, cdots, s_{i-1}, s_{i 1}, cdots, s_n) \ s = (s_i, s_{-i}) ] (S): 所有人的所有策略组合。 (S_{-i}): 除了玩家(i)以外,所有人的所有策略组合。 (s): 所有人的一种策略组合。 (s_{-i}): 除了玩家(i)以外,所有人的一种策略组合。 引进(S_{-i})和(s_{-i})是为了
- 通过看玩家i以外的所有玩家的策略,来考虑玩家i的策略。
- 或者专门看玩家i策略。
劣势(被支配)策略(Dominated Strategies)
- 定义 4.1:严格劣势于 对于玩家i,策略(s'_i)严格劣势于(s_i),则:
[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), forall s_{-i} in S_{-i} ]
断言 4.1
一个理性玩家不会选择一个严格劣势策略。
优势策略(Dominant Strategies)
- 定义 4.2: 严格优势策略(strictly dominant strategy) 策略(s_i in S_i)是一个严格优势策略,如果玩家i的任何其它策略都严格劣势于(s_i)。
[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), forall s'_i in S_i, s'_i neq s_i, and forall s_{-i} in S_{-i} ]
- 定义 4.3: 严格优势策略均衡(strictly dominant strategy equilibrium) 策略组合(s^D in S_i)是一个严格优势策略均衡,如果其中每一个玩家i的策略都是严格优势策略。
[ s_i equiv s_i^D, forall i in N ]
推论 4.1
如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D),则(s^D)是唯一的严格优势策略均衡。
断言 4.2
如果有的话,玩家一定会选择优势策略。
策略,策略集合,策略组合和策略均衡
- 策略(strategy) (s_i)是玩家的一个策略。
- 策略集合(strategy set) (S_i)是玩家的所有策略集合。(s_i in S_i) (S)是所有玩家的所有策略的组合的集合。
- 策略组合(strategy profile) (s)是N个玩家的一种策略组合。(s = (s_1, s_2, cdots, s_n), s in S)
- 策略均衡(strategy equilibrium) (s)是任何一种导致合理结果的策略组合。
方法:严格劣势策略的迭代消除
博弈论方法就是一个寻找均衡的过程。 方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies) 基本逻辑:
一个理性玩家不会选择一个严格劣势策略。 如果有的话,玩家一定会选择优势策略。 过程:略
- 迭代消除均衡(Iterated elimination equilibrium) 严格劣势策略的迭代消除(IESDS)过程中幸存下来的博弈组合(s^{ES})。
推论 4.2
如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N})),(s^*)是一个严格优势策略均衡,则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。
信念(Beliefs),最佳响应(Best Response)和可合理化(Rationalizability)
在已经学习的两个方法严格优势策略和严格劣势策略的迭代消除(IESDS)之外的情况下,如果玩家i的一个策略(s_i)不是一个严格劣势策略,那就意味着在一定条件下(对手的某些策略下),策略(s_i)是一个合理的响应。
- 最佳响应(best response) 玩家i的策略(s_i in S_i)是对手策略(s_{-i} in S_{-i})的最佳响应,则: [ v_i(s_i, s_{-i}) geq v_i(s'_i, s_{-i}), forall s'_i in S_i ]
- 信念(belief) 一个玩家i的信念就是一个他对手们的可能策略组合(s_{-i} in S_{-i})。
- 最佳响应对应(best-response correspondence) 最佳响应对应(BR_i(s_{-i})),是玩家i,在他的对手们的策略组合(s_{-i})上的所有可能最佳响应的集合。 (BR_i(s_{-i}))可以认为是一个函数,其结果是一个集合。
- 不是一个最佳响应(never a best response) 玩家i,对于他的对手们的策略组合(s_{-i})的最佳响应集合(BR_i(s_{-i})),如果(s_{-i})不是在信任集合里,则(s_i in BR_i(s_{-i}))都不是最佳响应。
总结
方法
- 严格优势策略
- 严格劣势策略的迭代消除(IESDS)
- 去掉不可信的策略组合(或者保留可信的策略组合)。
推论 4.1
如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D),则(s^D)是唯一的严格优势策略均衡。
推论 4.2
如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N})),(s^*)是一个严格优势策略博弈,则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。
推论 4.3
对于玩家i,一个严格劣势策略(s_i),不可能是任何(s_{-i} in S_{-i})的最佳响应。
推论 4.4
在一个有限普通形式的博弈中,(s^*)是一个严格优势策略,或者是一个唯一的严格劣势策略的迭代消除(IESDS)均衡, 则s_i^*是一个对于任何(s_{-i} in S_{-i})的最佳响应。
断言 4.1
一个理性玩家不会选择一个严格劣势策略。
断言
如果有的话,玩家一定会选择优势策略。
断言 4.2
一个理性玩家,在认为他的对手选择策略(s_{-i} in S_{-i})时,总会选择(s_{-i})的最想响应。
断言
一个理性玩家只会选择(他对手们的策略组合的)最佳响应。
参照
- Game Theory An Introduction (by Steven Tadelis)
- 读书笔记: 博弈论导论 - 01 - 单人决策问题
- 读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
- 读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识