码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习【3】 朴素贝叶斯分类

时间:2014-08-26 09:53:05      阅读:200      评论:0      收藏:0      [点我收藏+]

标签:style   http   color   os   strong   for   ar   数据   line   

outlook temperature humidity windy play
  yes no   yes no   yes no   yes no yes no
sunny 2 3 hot 2 2 high 3 4 FALSE 6 2 9 5
overcast 4 0 mild 4 2 normal 6 1 TRUR 3 3    
rainy 3 2 cool 3 1                
如以上表格,现在我们来计算当条件为sunny,cool,high,TRUE时候是否去play,当然,决策树也可以,本节通过朴素贝叶斯来求解。

bubuko.com,布布扣 

B1,B2.....BN

首先来看下贝叶斯公式,B条件下A发生的概率,也就是在sunny,cool,high,TRUE等于yes的概率,以及等于no的概率,都计算出来,比较大小,哪个大,结果就是哪个。

P(YES|ALL) = P(ALL|YES)P(YES)/P(ALL) = P(SUNNY|YES)P(COOL|YES)P(HIGH|YES)P(TRUE|YES)P(YES)/P(ALL)

=2/9*3/9*3/9*3/9*9/14/P(ALL)=0.005/P(ALL)

P(NO|ALL) = P(ALL|NO)P(NO)/P(ALL) = P(SUNNY|NO)P(COOL|NO)P(HIGH|NO)P(TRUE|NO)P(NO)/P(ALL)

=3/5*1/5*4/5*3/5*5/14/P(ALL)=0.021/P(ALL)

所以得出是NO的概率大,所以在sunny,cool,high,true的条件下应该不去打球



注意表中有一个数据为0,这意味着在outlook为overcast的情况下,不打球和概率为0,即只要为overcast就一定打球,这违背了朴素贝叶斯的基本假设:输出依赖于所有的属性。












机器学习【3】 朴素贝叶斯分类

标签:style   http   color   os   strong   for   ar   数据   line   

原文地址:http://blog.csdn.net/simonchi/article/details/38842571

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!