博弈1-博弈论概述

OwwO99

一、博弈的基本概念

1.定义

在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。

2.分类

  • 静态博弈(逻辑时间同时)与动态博弈
  • 完全信息博弈与不完全信息博弈
静态动态
完全信息完全信息静态博弈
纳什均衡(纳什)
完全信息动态博弈
子博弈精炼纳什均衡(泽尔腾)
不完全信息不完全信息静态博弈
贝叶斯纳什均衡(海萨尼)
不完全信息动态博弈
精炼贝叶斯纳什均衡(泽尔腾)
  • 合作博弈与非合作博弈
  • 零和博弈与非零和博弈

二、博弈的标准型

1.基本形式

个参与者的博弈,其中博弈者从1到排序,设其中任一参与者的序号为,令代表参与者可以选择的策略集合(称为的策略空间),其中任意一个特定的策略用表示(有时我们写成表示策略是策略集中的要素)。令表示每个参与者选定一个策略形成的策略组合,表示第个参与者的收益函数,即为参与者选择策略时第个参与者的收益。

在一个人博弈的标准式表述中,参与者的策略空间为,收益函数为,我们用

表示此博弈。

2.要素

  • 博弈的参与者

  • 每一参与者可供选择的策略集

  • 针对所有参与者可能选择的策略组合,每一个参与者获得的收益

3.决策矩阵

决策A(参与人2)决策B(参与人2)
决策A(参与人1)a(参与人1收益),b(参与人2收益)c,d
决策B(参与人1)e,fg,h

三、博弈的解

1.重复剔除严格劣策略

  • 严格优势策略代表参与人的两个可行策略。如果对于其他参与者的每一个可能策略组合,选择的收益都大于其选择的收益,则称策略相对于策略是严格劣势策略。(即参与人选择策略,无论其他参与人选择什么,参与人没有动机去改变策略)

  • 严格劣势策略代表参与人的两个可行策略。如果对于其他参与者的每一个可能策略组合,选择的收益都小于其选择的收益,则称策略相对于策略是严格劣势策略。(即参与人选择策略,无论其他参与人选择什么,参与人动机去改变策略)

理性的参与者不会选择严格劣策略,在博弈开始前,找到所有参与者的严格劣策略,剔除,并重复。

例1

参与人1/2
A1,01,40,1
B0,50,32,0
  • 当参与人1选A时,参与人2选丙的收益(1)小于选乙的收益(4);当参与人1选B时,参与人2选丙的收益(0)小于选乙的收益(3)。丙是严格劣策略,剔除。
参与人1/2
A1,01,4
B0,50,3
  • 当参与人2选甲时,参与人1选B的收益(0)小于选A的收益(1);当参与人2选乙时,参与人1选B的收益(0)小于选A的收益(1)。B是严格劣策略,剔除。
  • 最后结果如下,博弈的解为(A,乙)。
参与人1/2
A1,01,4

2.最优对策与纳什均衡

  • 最优对策:对于其他参与人的策略组合,参与人选择策略的收益大于其他任意策略的收益,即

​ 对任意都成立,则称是参与人应对的最优对策。

  • 纳什均衡:如果在由每个博弈方的一个策略所组成的某个策略组合中,任意一方的策略都是其他参与人策略组合的最佳对策,则称为该博弈的一个纳什均衡。(即互为最优对策)

  • 纳什均衡和重复剔除严格劣策略的关系:

    纳什均衡不会被重复剔除严格劣策略剔除;如果重复剔除严格劣策略只剩唯一策略,则该策略就是此博弈的唯一纳什均衡。

例2

甲/乙
0,44,05,3
4,00,45,3
3,53,56,6
  • 首先,对于乙选择左,甲的最优应对为中(4),标记。对于乙选择中、右,也依次标记甲的最优应对。
  • 当甲分别选择上、中、下时,依次标记乙的最优应对。
  • 哪一个策略组双方都被标记了,该策略组即为纳什均衡(6,6)。

3.其他原则

(1)学会换位思考:用他人的得益去推测他人的策略,从而选择最有利于自己的策略。

(2)考虑参与人决策之间的对称性。

参考文献

[1] 博弈论基础,罗伯特·吉本斯

  • Title: 博弈1-博弈论概述
  • Author: OwwO99
  • Created at: 2023-09-05 10:22:06
  • Updated at: 2023-09-09 20:25:33
  • Link: https://redefine.ohevan.com/2023/09/05/2023-9-05-博弈1-博弈论概述/
  • License: This work is licensed under CC BY-NC-SA 4.0.
 Comments