博弈1-博弈论概述

一、博弈的基本概念

在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

	静态	动态
完全信息	完全信息静态博弈纳什均衡(纳什)	完全信息动态博弈子博弈精炼纳什均衡(泽尔腾)
不完全信息	不完全信息静态博弈贝叶斯纳什均衡(海萨尼)	不完全信息动态博弈精炼贝叶斯纳什均衡(泽尔腾)

个参与者的博弈，其中博弈者从1到排序，设其中任一参与者的序号为，令代表参与者可以选择的策略集合(称为的策略空间)，其中任意一个特定的策略用表示(有时我们写成表示策略是策略集中的要素)。令表示每个参与者选定一个策略形成的策略组合，表示第个参与者的收益函数，即为参与者选择策略时第个参与者的收益。

在一个人博弈的标准式表述中，参与者的策略空间为，收益函数为，我们用

表示此博弈。

	决策A(参与人2)	决策B(参与人2)
决策A(参与人1)	a(参与人1收益),b(参与人2收益)	c,d
决策B(参与人1)	e,f	g,h

严格优势策略：和代表参与人的两个可行策略。如果对于其他参与者的每一个可能策略组合，选择的收益都大于其选择的收益，则称策略相对于策略是严格劣势策略。(即参与人选择策略，无论其他参与人选择什么，参与人都没有动机去改变策略)
严格劣势策略：和代表参与人的两个可行策略。如果对于其他参与者的每一个可能策略组合，选择的收益都小于其选择的收益，则称策略相对于策略是严格劣势策略。(即参与人选择策略，无论其他参与人选择什么，参与人都有动机去改变策略)

理性的参与者不会选择严格劣策略，在博弈开始前，找到所有参与者的严格劣策略，剔除，并重复。

例1

参与人1/2	甲	乙	丙
A	1,0	1,4	0,1
B	0,5	0,3	2,0

参与人1/2	甲	乙
A	1,0	1,4
B	0,5	0,3

参与人1/2	甲	乙
A	1,0	1,4

对任意都成立，则称是参与人应对的最优对策。

纳什均衡：如果在由每个博弈方的一个策略所组成的某个策略组合中，任意一方的策略都是其他参与人策略组合的最佳对策，则称为该博弈的一个纳什均衡。(即互为最优对策)
纳什均衡和重复剔除严格劣策略的关系：
纳什均衡不会被重复剔除严格劣策略剔除；如果重复剔除严格劣策略只剩唯一策略，则该策略就是此博弈的唯一纳什均衡。

例2

(1)学会换位思考：用他人的得益去推测他人的策略，从而选择最有利于自己的策略。

(2)考虑参与人决策之间的对称性。

[1] 博弈论基础，罗伯特·吉本斯