码迷,mamicode.com
首页 > 其他好文 > 详细

在写德州扑克AI的时候想到的一种实现模糊决策的方法

时间:2015-04-16 23:47:49      阅读:401      评论:0      收藏:0      [点我收藏+]

标签:ai   模糊处理   决策   

目前的AI决策方式是线性的,给定了一个条件X,代入一条曲线获得一个Y后直接作为决策值。略略灵活一点的,从两条曲线中取得两个值Y1,Y2,然后随机从两者中间的区域中取得一个值。
技术分享
但是,这样做会使AI表现出非常明显的“边界”,与AI交流能够明显的感觉的AI的限度在哪里。感觉会比较“僵硬”。原因在于人类的决策过程并没有这种边界。当我们面对某一个条件X的时候,我们的决策“曲线”应该是这个样子的
技术分享
如图,人类的决策没有明显的边界,所以看起来非常的模糊。模糊处理貌似是一个非常普遍的,在AI领域研究的比较多的内容。
我最近也一直在想如何能够实现这种模糊决策逻辑。最近忽然想到它既然能被表示成模糊的图像,为何不直接使用图像。
这种思路是从一张图片开始,为了简单,我们假设是一张32*32的图。
技术分享
技术分享
我们假设左下角为0点,横向为X纵向为Y。将这个图片读到计算机里面,读取每一个像素的红色色值,组成一个32*32的矩阵。矩阵横向表示条件参数X,纵向表示Y值可能的概率分布。
这样对应与每一个X值,我们都能够获得一个数列。在这个简单的例子里面,我们假设X=18,获得下面这样一条曲线。
技术分享
技术分享
这个曲线中,横坐标表示可能取到的Y值,纵坐标表示一个与Y值出现的概率成正比的数值,我们姑且称之为F(Y). 假设对图上这一系列离散的点进行求和得到的值为Σ,那么Y的概率分布函数P(Y)就可以表示为P(Y)=F(Y)/Σ。我们暂且不管他,就直接用这个F(Y)。我们把这些数值拼接在一起,并且记住每一个F(Y)所对应的Y值。

技术分享

上面的饼图很好的说明了这种操作,这个饼一周的刻度是Σ即3009,右边的颜色表表明了饼上面每一个颜色区域表示的Y值。接下来的工作就所剩无几了。我们沿顺时针方向随机一个0~3009之间的数值,你会发现这个随机过程恰恰满足了我们所要追求的P(Y)概率分布函数。

这样,经过切片,排序,随机这三个过程,我们就从一个给定条件X获得了一个“模糊”的Y值。这种方式远远比用包络线来定义上下界要科学的多,我想如果用这种原理构建AI的决策系统,必然会让其非常的灵活,自然又不失规律性。

在写德州扑克AI的时候想到的一种实现模糊决策的方法

标签:ai   模糊处理   决策   

原文地址:http://blog.csdn.net/stupidcodegenerator/article/details/45082485

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!