在写德州扑克AI的时候想到的一种实现模糊决策的方法

时间：2015-04-16 23:47:49 阅读：401 评论：0 收藏：0 [点我收藏+]

标签：ai 模糊处理决策

目前的AI决策方式是线性的，给定了一个条件X，代入一条曲线获得一个Y后直接作为决策值。略略灵活一点的，从两条曲线中取得两个值Y1，Y2，然后随机从两者中间的区域中取得一个值。

但是，这样做会使AI表现出非常明显的“边界”，与AI交流能够明显的感觉的AI的限度在哪里。感觉会比较“僵硬”。原因在于人类的决策过程并没有这种边界。当我们面对某一个条件X的时候，我们的决策“曲线”应该是这个样子的

如图，人类的决策没有明显的边界，所以看起来非常的模糊。模糊处理貌似是一个非常普遍的，在AI领域研究的比较多的内容。

我最近也一直在想如何能够实现这种模糊决策逻辑。最近忽然想到它既然能被表示成模糊的图像，为何不直接使用图像。

这种思路是从一张图片开始，为了简单，我们假设是一张32*32的图。

我们假设左下角为0点，横向为X纵向为Y。将这个图片读到计算机里面，读取每一个像素的红色色值，组成一个32*32的矩阵。矩阵横向表示条件参数X，纵向表示Y值可能的概率分布。

这样对应与每一个X值，我们都能够获得一个数列。在这个简单的例子里面，我们假设X=18，获得下面这样一条曲线。

这个曲线中，横坐标表示可能取到的Y值，纵坐标表示一个与Y值出现的概率成正比的数值，我们姑且称之为F(Y). 假设对图上这一系列离散的点进行求和得到的值为Σ，那么Y的概率分布函数P(Y)就可以表示为P(Y)=F(Y)/Σ。我们暂且不管他，就直接用这个F(Y)。我们把这些数值拼接在一起，并且记住每一个F(Y)所对应的Y值。

上面的饼图很好的说明了这种操作，这个饼一周的刻度是Σ即3009，右边的颜色表表明了饼上面每一个颜色区域表示的Y值。接下来的工作就所剩无几了。我们沿顺时针方向随机一个0~3009之间的数值，你会发现这个随机过程恰恰满足了我们所要追求的P(Y)概率分布函数。

这样，经过切片，排序，随机这三个过程，我们就从一个给定条件X获得了一个“模糊”的Y值。这种方式远远比用包络线来定义上下界要科学的多，我想如果用这种原理构建AI的决策系统，必然会让其非常的灵活，自然又不失规律性。

在写德州扑克AI的时候想到的一种实现模糊决策的方法

标签：ai 模糊处理决策

原文地址：http://blog.csdn.net/stupidcodegenerator/article/details/45082485

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行