标签:生成算法 高斯分类器 logistic 机器学习 朴素贝叶斯
贝叶斯公式:
写成表达式的形式:
分离效果图:
原理:根据上述表达式的形式和最大似然原理,我们要求出这两个高斯分布,使给出的case最大限度的符合。
写成表达式的形式:
原因:为什么要求
因为我们是要求给出
根据贝叶斯公式:
如果
反之不一定成立。
将文本分词处理,得到特征值向量(整个词汇表):
0表示该次在这个case中没出现,1表示出现
那么该case出现的概率:
模型中的参数:
所以:
joint(联合)最大似然估计:
解:
就是样本出现的频率。如
根据参数我们可以写出预测:
当一个单词从未出现的时候,进行预测的时候参数可能为0
即:
解决方法:
版权声明:本文为博主原创文章,未经博主允许不得转载。
标签:生成算法 高斯分类器 logistic 机器学习 朴素贝叶斯
原文地址:http://blog.csdn.net/neu_chenguangq/article/details/46654009