码迷,mamicode.com
首页 > 编程语言 > 详细

生成算法

时间:2015-06-27 09:56:38      阅读:135      评论:0      收藏:0      [点我收藏+]

标签:生成算法   高斯分类器   logistic   机器学习   朴素贝叶斯   

思路:

  • 之前的线性回归都是根据特征值服从的分布猜想结果,生成算法是根据结果猜想特征值的分布。
  • 贝叶斯公式:

    技术分享

GDA高斯分类器:

模型:

  1. 技术分享

  2. 写成表达式的形式:

    技术分享

  3. 分离效果图:

    技术分享

推理:

  1. 原理:根据上述表达式的形式和最大似然原理,我们要求出这两个高斯分布,使给出的case最大限度的符合。

  2. 写成表达式的形式:

    技术分享

    原因:为什么要求p(y|x)的最大似然:

    • 因为我们是要求给出X后预测Y,因此我们要求给出x下y的最可能出现的情况下的θ

    • 根据贝叶斯公式:

      技术分享

GDA and Logistic 回归:

  • 如果p(x|y;θ) 服从高斯分布,可以推出:p(y=1|x;θ)服从Logistic 回归。即:

    技术分享

  • 反之不一定成立。

朴素贝叶斯分类:

应用:

  • 主要用于文本分类

模型:

  1. 将文本分词处理,得到特征值向量(整个词汇表):
    0表示该次在这个case中没出现,1表示出现

    技术分享

  2. 那么该case出现的概率:

    技术分享

  3. 模型中的参数:

    • 对于第i个特征值,有它在y=1时出现的概率,y=0时出现的概率
    • 还有y=1 出现的概率

    所以:

    • ?i|y=1=p(xi=1|y=1)
    • ?i|y=0=p(xi=1|y=0)
    • ?y=p(y=1)
  4. joint(联合)最大似然估计:

    技术分享

    解:

    技术分享

    就是样本出现的频率。如 ?y=p(y=1) ,就是y=1占样本空间的比例

  5. 根据参数我们可以写出预测:

    技术分享

Laplace smoothing

  1. 当一个单词从未出现的时候,进行预测的时候参数可能为0

    即:

    技术分享

  2. 解决方法:

    技术分享

    技术分享

版权声明:本文为博主原创文章,未经博主允许不得转载。

生成算法

标签:生成算法   高斯分类器   logistic   机器学习   朴素贝叶斯   

原文地址:http://blog.csdn.net/neu_chenguangq/article/details/46654009

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!