博弈论斯坦福game theory stanford week 2.0_

时间：2018-03-04 18:06:51 阅读：210 评论：0 收藏：0 [点我收藏+]

title: 博弈论斯坦福game theory stanford week 2-0
tags: note
notebook: 6- 英文课程-15-game theory
---

博弈论斯坦福game theory stanford week 2-0

混合策略和纳什均衡

一个例子

我们从一个例子说起，我们说美国人为了保护自己的利益，在索马里设卡安检，我们不妨考虑这样的博弈问题，说在索马里有很多的路段，安检者和恐怖袭击者是博弈者。如果袭击和安检发生在同一地点，那么袭击者会受到损失，如果不是，袭击者会得到好处。对于检查者问题正好相反。

但是由于没有相应的情报支持，两者的决策只能依靠随机进行，并不会产生固定的决策，这样的策略称为混合策略。

混合策略，

Kv
就像上面的例子一样，我们考虑这个决策问题：

技术分享图片

两个人的利益看起来并不能通过固定的选择方式进行分割，只能通过随机的选择，这样就是混合策略。

下面我们定义下这种决策，

决策： $技术分享图片$ ，决策是行动 $技术分享图片$ 的一个随机变量
纯策略：在概率中只有一个行为可以采用。
混合策略：在我们的策略中，可以采用多种策略。
在这些策略中，所有的行为称为策略的支撑。

我们还要定义所有的策略 $技术分享图片$
我们还要定义所有策略的收益 $技术分享图片$

在上述的情况下，我们可以对我们的收益和支出进行概率性的讨论。

我们可以定义期望的收益如下：

技术分享图片

第一行的公式是说，当前的收益是所有的行为带来的利益的加权平均值，第二行说我们可以使用贝叶斯公式来计算每一个的可能性。

最优响应和纳什均衡

技术分享图片

借助最优相应的概率，我们将上述的概率化思想融入进来，
得到一个定理：

每一个完整的博弈都有一个纳什均衡

完整的博弈的定义是什么：只要一个博弈，拥有一定的数量的博弈者，有着一定的行为，有着完整的收益矩阵，那么就是一个完整的博弈。

做一个说明：我们之前说的没有纳什均衡是说没有纯粹的纳什均衡，但是它可以有混合的纳什均衡。

比如我们前面提到的例子，如下图：

技术分享图片

我们的混合的纳什均衡就是：
技术分享图片
这个样子的

要强调混合的概率是随着不同的问题决定的，那么混合的概率是如何决定的呢，我们可以认为当所有的博弈者都不愿意再改变他们的概率的时候，就陷入了纳什均衡。

纳什均衡的计算

一个例子

通过这样的一个示例我们讨论纳什均衡的计算方法：
技术分享图片
我们不得不说再一般的条件下，纳什均衡是十分难以计算的，不过如果你合一对支持进行猜测的情况下，我们可以相对容易的计算纳什均衡。

再上图情况下，我们假设让一个人选b的概率为 $技术分享图片$ ，选F的概率就是 $技术分享图片$
再这个情况下，另外一个决策者用混合策略来考虑这个问题，他需要保证对方这两种博弈行为对自己来说是一种平衡的收益，因为只有这样，另外一个博弈者的收益才不会因为对方的选择而发生改变。因此我们采用如下的策略列出方程:

技术分享图片

使用混合策略的原因

通过随机性来迷惑你的对手
通过随机性来应对不确定性

多方博弈问题

两个例子

线性补充问题（linear complementarity problem）

支持计数方法（support enumeration method）

PPAD问题

美国加州大学伯克利分校的克里斯托斯·帕帕迪米特里欧(Christos Papadimitriou) 教授定义了PPAD（polynomial parity arguments on directed graphs，有向图的多项式校验参数）计算复杂类来描述经济学中的计算问题。并与其合作者一起证明了在4 人及以上的博弈中，纳什均衡的计算是属于PPAD-Complete 的。

技术分享图片