朴素贝叶斯分类(NBC)是机器学习中最基本的分类方法,是其他众多分类算法分类性能的对比基础,其他的算法在评价性能时都在NBC的基础上进行。同时,对于所有机器学习方法,到处都蕴含着Bayes统计的思想。
朴素贝叶斯基于贝叶斯地理和特征条件独立性假设,首先基于条件独立性假设学习输入XX和输出YY的联合分布P(X,Y)P(X,Y),同时利用先验概率P(Y)P(Y),根据贝叶斯定理计算出后验概率P(Y|X...
分类:
其他好文 时间:
2015-04-27 02:06:20
阅读次数:
259
转载请注明出处: http://xiahouzuoxin.github.io/notes/判别学习算法和生成学习算法高斯判别分析(Gaussian Discriminant Analysis)朴素贝叶斯算法(Naive Bayesian)拉普拉斯平滑(Laplace smoothing)判别学习算法和生成学习算法判别学习算法:直接学习p(y|x),即直接通过输入特征空间x去确定目标类型{0,1},...
分类:
其他好文 时间:
2015-04-23 17:32:17
阅读次数:
228
朴素贝叶斯(Naive Bayes)适用于离散特征的分类问题,对于连续问题则需将特征离散化后使用。朴素贝叶斯有多元伯努利事件模型和多项式事件模型,在伯努利事件模型中,特征每一维的值只能是0或1,而多项式模型中特征每一维的值可取0到N之间的整数,因此伯努利模型是多项式模型的一种特例,下面的推导就直.....
分类:
其他好文 时间:
2015-04-21 17:30:50
阅读次数:
213
处女文献给我最喜欢的算法了⊙▽⊙---------------------------------------------------我是机智的分割线----------------------------------------------------[important] 阅读之前你需要了解:....
分类:
编程语言 时间:
2015-04-20 22:26:40
阅读次数:
283
K-means算法属于无监督学习聚类算法,其计算步骤还是挺简单的,思想也挺容易理解,而且还可以在思想中体会到EM算法的思想。K-means 算法的优缺点:
1.优点:容易实现
2.缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢
使用数据类型:数值型数据以往的回归算法、朴素贝叶斯、SVM等都是有类别标签y的,因此属于有监督学习,而K-means聚类算法只有x,没有y在聚类问题中,我们的...
分类:
编程语言 时间:
2015-04-17 13:54:08
阅读次数:
162
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类
对于分类问题,其实谁都不会陌生,每个人生活中无时不刻的在进行着分类。例如,走在大马路上看到女孩子,你会下意识的将她分为漂亮和不漂亮(漂亮当然就多看几眼啦)。在比如,在路上遇到一只狗,你会根据这只狗的毛发脏不脏,然后想到这是一只流浪狗还是家养的宠物狗。这些其实都是生活中的分类操作。
而贝叶斯分类是在生活中分类的...
分类:
编程语言 时间:
2015-04-17 11:30:47
阅读次数:
257
from numpy import *
# 创建一个实验样本
def loadDataSet():
postingList = [['my','dog','has','flea','problems','help','please'],
['maybe','not','take','him','to','dog','park','stupid'...
分类:
其他好文 时间:
2015-04-15 19:38:37
阅读次数:
160
机器学习笔记:朴素贝叶斯方法(Naive Bayes)原理和实现本文主要描述了朴素贝叶斯分类方法,包括模型导出和学习描述。实例部分总结了《machine learning in action》一书中展示的一个该方法用于句子感情色彩分类的程序。
方法概述
学习(参数估计)
实现:朴素贝叶斯下的文本分类
模型概述
朴素贝叶斯方法,是指
朴素:特征条件独立贝叶斯:基于贝叶斯定理
根据贝叶斯定理,对一个分类...
分类:
其他好文 时间:
2015-04-13 01:46:03
阅读次数:
356
贝叶斯决策理论要求计算两个概率p1(x,y)和p2(x,y)1.如果p1(x,y)>p2(x,y),那么类别为12.如果p1(x,y)p(c2|x,y),那么属于类别c11.如果p(c1|x,y)<p(c2|x,y),那么属于类别c2朴素贝叶斯分类器中的另一个假设是,每个特征同等重要。朴素贝叶斯分类...
分类:
其他好文 时间:
2015-04-12 22:42:30
阅读次数:
153
生成学习算法本次课程大纲:1、生成学习算法2、高斯判别分析(GDA,Gaussian Discriminant Analysis)-高斯分布(简要)-对比生成学习算法&判别学习算法(简要)3、朴素贝叶斯4、Laplace平滑复习:分类算法:给出一个训练集,若使用logistic回归算法,其工作方式是...
分类:
编程语言 时间:
2015-04-11 14:48:14
阅读次数:
209