【算法设计】（综合）博弈树的了解与创建

时间：2017-02-13 08:11:58 阅读：742 评论：0 收藏：0 [点我收藏+]

对博弈树的理解简单而言就是对每一步可能的结果进行分析之后对当前步骤的下一步的所有可能结果进行分析而创建的树

专业表示极大极小博弈树：极大极小博弈树是因描绘这种结构的一种简单算法而得名。我们来对ttt游戏的结果分配一下分值。如果叉（X）获胜，则分值为1。如果圈（O）获胜，则分值为-1。现在，叉将试图获得最大化的分值，而圈将试图最小化分值。于是，第一位研究此问题的研究者决定把游戏者叉命名为max，并且把游戏者圈命名为min。因此，这个完整的数据结构就被命名为极大（Max）极小（Min）博弈树。

例如：技术分享

对于博弈树的创立过程需要对于任意种可能结果设定权重：例如黑白棋中设立以下几种权重

连三 100分

双连二 50分

平局 0分

不分胜负 1

其中如果评分时不分胜负则还会继续搜索，直到找到其他三种状态、

利用博弈树时，由于结果可能很多所以需要进行必要剪枝，算法思路如下：

min电脑AI下棋时，如果考虑步数为0，则代表直接返回当前棋盘估值w（值越大代表对max越有优势，越小则代表对min越有优势，w=maxW-minW）。
如果考虑步数为N，先获取min电脑可以下棋的位置steps。
对于可以下棋的一步step，电脑AI下棋到step的第row行，第column列。
如果这时候min电脑已经赢了，则把棋盘回退一步，返回棋盘估值和下棋位置，不用再考虑其他走法了。
否则，min需要在每一种走法里面，选择一种走法，令max人类走N-1步之后，自己的优势保持最大（即w值最小）。
什么是alpha-beta剪枝呢？就是如果max人类当前一种走法1至少可以获取alpha优势，而另一种走法2，min电脑的一步棋则可能让人类获取比alpha更小的优势，那么max人类肯定不会选择走法2，所以计算在计算min电脑的走法时，min电脑的其他走法就不用再计算了。
最后min电脑经过steps.length种走法对比之后，选择w值最小的一种走法，把棋盘回退一步，并返回棋盘估值和下棋位置。
max走法类似，人类会选择w值最大的走法下棋，所以max函数和min函数分别代表人和AI下棋，互相递归调用，直到递归到步数为0时返回N步之后的估值。

如果一棵树博弈树的每个内部结点的第一个子结点都返回最优的解,那么称这棵树是良序的.对一个良序的博弈树,Alpha-Beta算法会修剪一些无必要搜索的子树,修剪之后的树就称为最小树（minimal tree,或者critical tree）.当博弈树是良序的时候,Alpha-Beta算法所需要搜索子树都包含在这个最小树中.按照上述结点的分类方法,最小树中的所有结点的类型都是已定的,因为那些类型为undefined的结点都会被剪枝.

技术分享

均匀博弈树及其最小树

如果一个博弈树的所有内部结点（interior node）具有相同的分支因子,且所有的根结点到叶结点的深度相同,那么该搜索树就是一个均匀的（uniform）.对于一个深度为d的均匀良序博弈树的的最小树,从根结点到叶结点,经历了d个边.设第i个边是其父结点的第技术分享个分支.将所有按照“.”连接起来形成一个串:.设为该串中第一个大于1的值.如果不存在,即所有的都为1,则该叶结点为PV结点.如果存在,那么对应边的子结点一定为CUT结点.这时如果d - j是偶数,那么该串对应的叶结点为CUT结点,否则,如果d - j是奇数,该叶结点为ALL结点.

对一个CUT类型的叶结点,它对应的串存在着性质:对所有i,如果d - j是偶数,则技术分享为1.这种串（除了全1的串）和CUT叶结点一一对应.这种串的个数为,故此CUT叶结点的个数也为.

同样,对一个ALL类型的叶结点,它对应的串存在着性质:对所有i,如果d - j是奇数,那么为1.这样的串（除了全1的串）和ALL叶结点一一对应.这样的串的个数为技术分享 ,所以ALL叶结点的个数为.再加上PV叶结点,一个最小树包含的叶结点个数为,这也是在均匀博弈树中Alpha-Beta算法搜需要搜索的最少叶结点个数.

参考博弈树建立代码。

int gameState(char _board[9])
{
    int state;
    static int table[][3] = 
    {
        {0, 1, 2},
         {3, 4, 5},
          {6, 7, 8},
         {0, 3, 6},
          {1, 4, 7},
          {2, 5, 8},
          {0, 4, 8},
          {2, 4, 6},
      };
    char chess = _board[0];
     for (char i = 1; i < 9; ++i)
      {
         chess &= _board[i];
     }
      bool isFull = 0 != chess;
     bool isFind = false;
    for (int i = 0; i < sizeof(table) / sizeof(int[3]); ++i)
    {
        chess = _board[table[i][0]];
          int j;
        for (j = 1; j < 3; ++j)
            if (_board[table[i][j]] != chess)
                break;
            if (chess != empty && j == 3)
            {
                isFind = true;        
                break;
            }
        }
        if (isFind)
            //got win or lose
            state = chess == o ? WIN : LOSE;
        else
        {
            if (isFull)
                //all position has been set without win or lose
                return DRAW;
            else
            {
                //finds[0] -> ‘o‘, finds[1] -> ‘x‘
                int finds[2] = {0, };
                for (int i = 0; i < sizeof(table) / sizeof(int[3]); ++i)
                {
                    bool findEmpty = false;
                    chess = 0xff;
                    int j;
                    for (j = 0; j < 3; ++j)
                        if (_board[table[i][j]] == empty && !findEmpty)
                            findEmpty = true;
                        else
                         chess &= _board[table[i][j]];
                if ((chess == o || chess == x) && findEmpty)
                {
                    isFind = true;        
                    if (o == chess)
                         ++finds[0];
                     else
                        ++finds[1];
                 }
            }
             if (finds[0] > 1 && finds[1] < 1)
                 //2 ‘o‘ has been founded twice in row, column or diagonal direction
                 state = -(INFINITY / 2) * finds[0];
             else if (finds[1] > 1 && finds[0] < 1)
                 //2 ‘x‘ has been founded twice in row, column or diagonal direction
                 state = INFINITY / 2 * finds[1];
             else
                 //need to search more.
                 state = INPROGRESS;
         }
    }
     return state;
 }

【算法设计】（综合）博弈树的了解与创建

标签：arch 数据 magic lis 综合存在 har enter 评分

原文地址：http://www.cnblogs.com/KID-XiaoYuan/p/6392209.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行