码迷,mamicode.com
首页 > 其他好文 > 详细

博弈论基础

时间:2020-07-29 17:29:51      阅读:58      评论:0      收藏:0      [点我收藏+]

标签:span   没有   动态规划   判断   完全   博弈论   存在   硬币   hdu3951   

具有胜败游戏的基础
通过分析各个状态的胜败条件,判断必胜态和必败态,是具有胜败游戏的基础。

首先判断最终状态的胜败(比如两人轮流取硬币,没有硬币可取的一方失败,则硬币数\(x=0\)为必败态)
如果某个状态的后继状态中存在必败态,则这个状态为必胜态
如果某个状态的后继状态全部为必胜态,则这个状态为必败态

通常使用搜索或者动态规划遍历所有状态,判断每一个状态是必胜态还是必败态
对称策略
对称策略是一种常见的博弈策略,是指在游戏中做出对称状态后再完全模仿对手的策略
如果轮到自己时可以将状态分成对称的两部分,那么不管对手怎么选取,自己只要采取同样的方法在对称的部分中选取,就可以重新回到两个相同部分的状态。这样可以使得自己取走最后一件物品,对手在下一回合因为没有物品可以选择而失败

相关题目:hdu3951 Coin Game
\(n\)枚硬币围成一个环,两人轮流取硬币,每一次可以取\([1,k]\)范围内的连续的硬币,没有硬币可取的一方失败,两人都采取最优策略,判断谁会赢得游戏。

先手第一次取过硬币之后,如果没有全部取完,则所有硬币会变成一条链,后手可以在链的中间根据奇偶性的情况取1枚或者2枚硬币,使得整条链分成完全相同的两部分,然后后手可以采取对称策略赢得比赛。
所以当\(n\leq k\)时,先手第一次可以取完所有硬币,先手赢得游戏,其他情况除了\(k==1\)之外,全部是后手采取对称策略赢得比赛,\(k==1\)的情况直接根据\(n\)的奇偶性判断。

博弈论基础

标签:span   没有   动态规划   判断   完全   博弈论   存在   硬币   hdu3951   

原文地址:https://www.cnblogs.com/fxq1304/p/13398075.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!