标签:策略 简单 均衡 规则 一个 解决问题 计算 情况 博弈
纳什均衡简单的理解:在这种策略下,任何一位玩家都不愿意单方面的改变自己的策略。
本系列讨论:如何用代码计算两人零和博弈的纳什均衡
例如这样一个赌局
规则:两人各自亮出硬币的一面。如果两人都是正面,那么A给B3元,如果两人都是反面,A给B1元,剩下的情况B给A2元。
这个赌局看似公平,但其实非也。
分析:假设A以p1、p2的概率出正面、反面。
当B出正面时,A的收益为:w1=-3元*p1+2元*p2
当B出反面时,A的收益为:w2=2元*p1-1元*p2
令w1=w2
得p1=3/8,w1=w2=1/8
可见,A可以通过合理的策略获得优势。
当然,我们也可以用代码来解决问题。
标签:策略 简单 均衡 规则 一个 解决问题 计算 情况 博弈
原文地址:http://www.cnblogs.com/libai666/p/7266828.html