读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈建立信誉

时间：2018-02-04 13:55:22 阅读：130 评论：0 收藏：0 [点我收藏+]

标签：使用 www 常量 down www. period cti 为什么 layer

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈建立信誉

建立信誉(Building a Reputation)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

为什么我们要建立良好的信誉？为什么我们更愿意和有信誉的人交往？
本章从囚徒困境这个问题，证明了即使在2阶段的囚徒困境中，如果一方有可能选择合作（也就是沉默），另一个方在第一阶段也有可能选择合作。
让我们回忆一下囚徒困境。
囚徒困境的均衡是双方都告密。
在有限多阶段的囚徒困境中的均衡仍然是双方都告密。
在无限多阶段的囚徒困境中的均衡是双方合作沉默。

本章给出了一个囚徒困境的例子，在这个例子中，存在一个不完整信息，就是玩家1有两种类型：
1) 标准策略类型; 2) grim-trigger 策略类型。
这个grim-trigger 策略是：在第一个阶段博弈中，选择合作(C)，在一个t > 1阶段中，选择合作(C)仅仅当玩家2在上一个阶段中选择合作(c)。
\(p > 0\)为自然选择玩家1是grim-trigger 策略类型的可能性。

		Player 2
		c	d
player 1	C	1, 1	-1, 2
	D	2, -1	0, 0

玩家2使用标准策略，因此在第2阶段会选择叛变(defect)。
但是在第1阶段中选择合作和叛变，其收益分别为:
\[ \text{choose c in period 1} \v_{2a} = p(1) + (1 - p)(-1) + p(2) = 4p - 1 \\text{choose d in period 1} \v_{2b} = p(2) + (1 - p)(0) + p(0) = 2p \]

结论 17.1

在两阶段中，当\(p > \frac{1}{2}\)时，玩家2会选择合作。

结论 17.2

在3阶段的这个囚徒困境博弈中，玩家1和玩家2在第一阶段都会选择合作。

推论 17.1

在T阶段的这个囚徒困境博弈中，T是一个大的值。玩家1和玩家2选择叛变的阶段数被一个常量M限制。而M与p有关，与T无关。

参照

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈建立信誉

标签：使用 www 常量 down www. period cti 为什么 layer

原文地址：https://www.cnblogs.com/steven-yang/p/8412849.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉

建立信誉(Building a Reputation)

参照

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈建立信誉

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈建立信誉