码迷,mamicode.com
首页 > 其他好文 > 详细

朴素贝叶斯(Naive Bayes)

时间:2016-07-01 16:03:08      阅读:128      评论:0      收藏:0      [点我收藏+]

标签:

朴素贝叶斯算法是基于贝叶斯定理的算法,贝叶斯定理如下:

\[P(Y|X) = \frac{P(X,Y)}{P(X)} = \frac{P(Y) \cdot P(X|Y)}{P(X)}\]

朴素贝叶斯是这样执行的,假设 $X$ 为数据的特征 其中每一维度均可看做一个随机变量,即 $X_1= x_1,X_2=x_2,...,X_n = x_n$ ,$Y = y_1,....,y_k$ 为对应的类标签, 对于给定的输入 $X$ ,朴素贝叶斯是这样预测其类别 $Y$ 的:

\begin{aligned}
P(Y = y_k|X_1 = x_1,X_2=x_2,...,X_n = x_n)
&=\frac{P(X_1 = x_1,X_2=x_2,...,X_n = x_n,Y = y_k)}{\sum_i P(X_1 = x_1,X_2=x_2,...,X_n = x_n)P(Y=y_i)} \\
&=\frac{P(Y =y_k) \cdot P(X_1 = x_1,X_2=x_2,...,X_n = x_n|Y = y_k)}{P(X_1 = x_1,X_2=x_2,...,X_n = x_n)} \\
&=\frac{P(Y =y_k) \cdot \prod_iP(X_i = x_i|Y = y_k)}{P(X_1 = x_1,X_2=x_2,...,X_n = x_n)} \\
\end{aligned}

这里第倒数第二步到最后一步就利用了特征间条件独立的特性。因为对于给定输入,其分布 $P(X=x_1,x_2,...,x_n)$ 为一个定值,所以分别求出 $P(Y=y_k|X=x_1,x_2,...,x_n)$ 中所有 $P=y_i $ 的概率,取最大的一个即可。所以可以得到样本 $X$ 的 类别 $y$:

\[有= \max_{y_k}P(Y=y_k) \prod_iP(X_i|Y=y_k)\]

这里需要注意的几个问题

1) 朴素贝叶斯是一个生成模型,需要对联合概率 $P(X,Y)$ 进行建模,然后对于给定的 $X$ 求得关于模型的后验估计 $Y$ 。

2) 朴素二字的含义指的是条件独立,即在类别确定的条件下,各个特征是条件独立的。根据条件独立的特性,上式中第二行才能转到第三行。

3)上式中的 $X_i$ 指把第 $i$ 个特征看做随机变量, $x_i$ 则代表第 $i$ 个特征 ,假设第 $i$ 个特征下有 $j$ 个取值,可以用  $x_{ij}$ 来表示 

4) 注意最后一步的极大化的操作,

根据以上分析可知,对于给定的输入 X = x_1,x_2,...x_n ,要得到其分别属于 $Y = y_k , \ k = 1,....K $ 的概率,需要知道已下参数,$P(Y= y_k)$,

朴素贝叶斯(Naive Bayes)

标签:

原文地址:http://www.cnblogs.com/ooon/p/5633293.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!