博弈1-博弈论概述
一、博弈的基本概念
1.定义
在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。
2.分类
- 静态博弈(逻辑时间同时)与动态博弈
- 完全信息博弈与不完全信息博弈
| 静态 | 动态 | |
|---|---|---|
| 完全信息 | 完全信息静态博弈 纳什均衡(纳什) | 完全信息动态博弈 子博弈精炼纳什均衡(泽尔腾) |
| 不完全信息 | 不完全信息静态博弈 贝叶斯纳什均衡(海萨尼) | 不完全信息动态博弈 精炼贝叶斯纳什均衡(泽尔腾) |
- 合作博弈与非合作博弈
- 零和博弈与非零和博弈
二、博弈的标准型
1.基本形式
在一个
表示此博弈。
2.要素
博弈的参与者
每一参与者可供选择的策略集
针对所有参与者可能选择的策略组合,每一个参与者获得的收益
3.决策矩阵
| 决策A(参与人2) | 决策B(参与人2) | |
|---|---|---|
| 决策A(参与人1) | a(参与人1收益),b(参与人2收益) | c,d |
| 决策B(参与人1) | e,f | g,h |
三、博弈的解
1.重复剔除严格劣策略
严格优势策略:
和 代表参与人 的两个可行策略。如果对于其他参与者的每一个可能策略组合, 选择 的收益都大于其选择 的收益,则称策略 相对于策略 是严格劣势策略。(即参与人 选择策略 ,无论其他参与人选择什么,参与人 都没有动机去改变策略) 严格劣势策略:
和 代表参与人 的两个可行策略。如果对于其他参与者的每一个可能策略组合, 选择 的收益都小于其选择 的收益,则称策略 相对于策略 是严格劣势策略。(即参与人 选择策略 ,无论其他参与人选择什么,参与人 都有动机去改变策略)
理性的参与者不会选择严格劣策略,在博弈开始前,找到所有参与者的严格劣策略,剔除,并重复。
例1
| 参与人1/2 | 甲 | 乙 | 丙 |
|---|---|---|---|
| A | 1,0 | 1,4 | 0,1 |
| B | 0,5 | 0,3 | 2,0 |
- 当参与人1选A时,参与人2选丙的收益(1)小于选乙的收益(4);当参与人1选B时,参与人2选丙的收益(0)小于选乙的收益(3)。丙是严格劣策略,剔除。
| 参与人1/2 | 甲 | 乙 |
|---|---|---|
| A | 1,0 | 1,4 |
| B | 0,5 | 0,3 |
- 当参与人2选甲时,参与人1选B的收益(0)小于选A的收益(1);当参与人2选乙时,参与人1选B的收益(0)小于选A的收益(1)。B是严格劣策略,剔除。
- 最后结果如下,博弈的解为(A,乙)。
| 参与人1/2 | 甲 | 乙 |
|---|---|---|
| A | 1,0 | 1,4 |
2.最优对策与纳什均衡
- 最优对策:对于其他参与人的策略组合
,参与人 选择策略 的收益大于其他任意策略的收益,即
对任意
纳什均衡:如果在由每个博弈方的一个策略所组成的某个策略组合
中,任意一方的策略都是其他参与人策略组合的最佳对策,则称 为该博弈的一个纳什均衡。(即互为最优对策) 纳什均衡和重复剔除严格劣策略的关系:
纳什均衡不会被重复剔除严格劣策略剔除;如果重复剔除严格劣策略只剩唯一策略,则该策略就是此博弈的唯一纳什均衡。
例2
| 甲/乙 | 左 | 中 | 右 |
|---|---|---|---|
| 上 | 0,4 | 4,0 | 5,3 |
| 中 | 4,0 | 0,4 | 5,3 |
| 下 | 3,5 | 3,5 | 6,6 |
- 首先,对于乙选择左,甲的最优应对为中(4),标记。对于乙选择中、右,也依次标记甲的最优应对。
- 当甲分别选择上、中、下时,依次标记乙的最优应对。
- 哪一个策略组双方都被标记了,该策略组即为纳什均衡(6,6)。
3.其他原则
(1)学会换位思考:用他人的得益去推测他人的策略,从而选择最有利于自己的策略。
(2)考虑参与人决策之间的对称性。
参考文献
[1] 博弈论基础,罗伯特·吉本斯
- Title: 博弈1-博弈论概述
- Author: OwwO99
- Created at: 2023-09-05 10:22:06
- Updated at: 2023-09-09 20:25:33
- Link: https://redefine.ohevan.com/2023/09/05/2023-9-05-博弈1-博弈论概述/
- License: This work is licensed under CC BY-NC-SA 4.0.