前言
一看到贝叶斯网络,马上让人联想到的是5个字,朴素贝叶斯,在所难免,NaiveByes的知名度确实会被贝叶斯网络算法更高一点。其实不管是朴素贝叶斯算法,还是今天我打算讲述的贝叶斯网络算法也罢,归根结底来说都是贝叶斯系列分类算法,他的核心思想就是基于概率学的知识进行分类判断,至于分类得到底准不准,大家尽可以自己用数据集去测试测试。OK,下面进入正题--贝叶斯网络算法。
朴素贝叶斯
一般我在...
分类:
其他好文 时间:
2015-06-29 20:35:18
阅读次数:
154
、 朴素贝叶斯算法 输入:训练数据T={(x1,y1),(x2,y2),…,(xN,yN)}, 输出:X的分类 计算先验概率及条件概率 计算朴素贝叶斯概率 选择概率最大的类 拉普拉斯平滑(Laplace smoothing) 朴素贝叶斯两大假设 条件独立假设用于分类的特...
分类:
其他好文 时间:
2015-06-08 23:19:16
阅读次数:
155
引文:由于之前讲过了朴素贝叶斯的理论Stanford机器学习[第五讲]-生成学习算法第四部分,同时朴素贝叶斯的算法实现也讲过了,见机器学习算法-朴素贝叶斯Python实现。那么这节课打算讲解一下朴素贝叶斯算法的具体计算流程,通过一个具体的实例来讲解。PS:为了专注于某一个细节,本章节只抽取了视频的一部分来讲解,只讲解一个贝叶斯算法的计算流程,关于视频里面的具体内容请参考下面的视频链接。讲解的实例是一...
分类:
编程语言 时间:
2015-06-01 18:56:18
阅读次数:
172
本课内容:
生成学习算法的介绍;
第一个典型的生成学习算法——高斯判别分析;
生成学习算法与之前的判别学习算法的对比;
朴素贝叶斯算法,
Laplace平滑。
1.生成学习算法学习算法分为两种:一种是判别学习算法(Discriminative Learning Algorithm),简称DLA,另一种是生成学习算法(Generative Learning Algorithm),简称GLA。DLADL...
分类:
编程语言 时间:
2015-05-31 16:57:02
阅读次数:
478
电子邮件垃圾过滤
1、如何从文本文档中构建自己的词列表。使用正则表达式切分句子,并将字符串全部转换为小写。
####################################
# 功能:切分文本
# 输入变量:大字符串 big_string
# 输出变量:字符串列表
####################################
def text_parse(b...
分类:
编程语言 时间:
2015-04-30 21:59:43
阅读次数:
183
转载请注明出处: http://xiahouzuoxin.github.io/notes/判别学习算法和生成学习算法高斯判别分析(Gaussian Discriminant Analysis)朴素贝叶斯算法(Naive Bayesian)拉普拉斯平滑(Laplace smoothing)判别学习算法和生成学习算法判别学习算法:直接学习p(y|x),即直接通过输入特征空间x去确定目标类型{0,1},...
分类:
其他好文 时间:
2015-04-23 17:32:17
阅读次数:
228
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类
对于分类问题,其实谁都不会陌生,每个人生活中无时不刻的在进行着分类。例如,走在大马路上看到女孩子,你会下意识的将她分为漂亮和不漂亮(漂亮当然就多看几眼啦)。在比如,在路上遇到一只狗,你会根据这只狗的毛发脏不脏,然后想到这是一只流浪狗还是家养的宠物狗。这些其实都是生活中的分类操作。
而贝叶斯分类是在生活中分类的...
分类:
编程语言 时间:
2015-04-17 11:30:47
阅读次数:
257
一、朴素贝叶斯(Naïve Bayes)分类器 1.1 公式 朴素贝叶斯是一个概率分类器 文档 d 属于类别 c 的概率计算如下(多项式模型): nd是文档的长度(词条的个数) P(tk |c) 是词项tk 出现在类别c中文档的概率,即类别c文档的一元语言模型 P(tk |c) 度量的是当c是正确类...
分类:
编程语言 时间:
2015-03-07 18:23:06
阅读次数:
657
朴素贝叶斯算法是寻找一个极大后验假设(MAP),即候选假设的最大后验概率。
如下:
在朴素贝叶斯分类器中,假设样本特征之间是独立的,则有:
计算每个假设的后验概率,选出最大的概率,对应的类别就是样本的分类结果。
优缺点:
对小规模的数据表现很好,适合多分类任务,适合增量式训练。当时,需要样本的特征之间独立性较高,不能有太多的相关性。对输入数据的表达形式很敏...
分类:
编程语言 时间:
2015-03-02 11:19:44
阅读次数:
297
快讯动机
现在每天真的是变化太快,太多的资讯信息铺天盖地而来,要想把每天遇到的大量的优质资讯信息进行学习吸收又非常的困难,所以特此做一个机器学习快讯专题,把平日遇到的优质文章整理罗列出来,等有时间或者遇到类似的问题的时候再看也是有益处的。
机器学习技术
12个用好朴素贝叶斯算法的小提示使用随机森林:Use
Random Forest: Testing 179 Classifi...
分类:
其他好文 时间:
2015-01-24 21:26:22
阅读次数:
248