码迷,mamicode.com
首页 > 其他好文 > 详细

朴素贝叶斯

时间:2016-03-29 10:54:44      阅读:142      评论:0      收藏:0      [点我收藏+]

标签:

4.1朴素贝斯法的学习与分类

4.1.1基本方法

        设输入空间技术分享为n维向量的集合,输出空间为类标记技术分享技术分享技术分享。P(X,Y)是X和Y的联合概率分布。训练数据集技术分享由P(X,Y)独立同分布产生。

         朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y),即先验概率分布技术分享和条件概率分布技术分享,从而学到联合概率分布P(X,Y)。

         条件概率分布有指数级的参数,假设技术分享可能的取值有技术分享个,j=1,2...,n,Y可能的取值有K个,那么参数个数为技术分享

        朴素贝叶斯对条件概率分布做了条件独立性的假设

技术分享(4.3)

即用于分类的特征在类确定的条件下都是条件独立的。

      朴素贝叶斯法分类时,对给定的输入x,通过学习到的模型计算后验概率分布:

技术分享(4.4)

将后延概率最大的类作为x的类输出。

将(4.3)带入(4.4)的得

技术分享

于是朴素贝叶斯分类器可表示为

技术分享


注意分母为常数项,所以

技术分享


4.1.1后验概率最大化的含义

朴素贝叶斯法将实例分到后验概率最大的类中,这等价于期望风险最小化。假设0-1损失函数

技术分享

f(X)是分类决策函数。这是,期望风险函数为

技术分享

期望是对联合分布P(X,Y)取得。由此取条件期望

技术分享

(哪位大神告诉我这个Ex啥意思)

为了使期望风险最小化,只需X=x逐一极小化,由此得到:

技术分享

朴素贝叶斯

标签:

原文地址:http://blog.csdn.net/pmt123456/article/details/50999282

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!