贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类,而朴素贝叶斯分类可谓是里面最简单、入门的一种。首先关于贝叶斯定理,感觉简单而伟大,前些天一直在看吴军的数学之美(没看过的极力推荐)系列文章,看到自然语言处理从规则模型到统计模型转变的时候,语言的识别准确率上升好几个等级,以至于今天的语言识别到达很强大的地步,同时对于搜索引擎,网页搜索的准确率,也上升好多。这其中的最最重...
分类:
编程语言 时间:
2015-08-05 12:51:53
阅读次数:
250
从本质上来说,这是一个分类问题,类似于通过邮件内容来推测垃圾邮件,通过用户的相关信息来推测用户是否会拖欠贷款,而通过用户的APP安装列表来推测用户的性别也是一个类似的问题。
对于贝叶斯算法来首,我们首先需要一个训练集数据,这个训练集是一个已经打好标签的数据。而要对一堆的数据打标签,人工来做是不太合适的,在这里需要结合人类与计算机各自的优势,来半自动化的识别出比较明显的有性别倾向的APP的...
分类:
移动开发 时间:
2015-07-31 16:24:08
阅读次数:
194
朴素贝叶斯算法主要用来解决分类问题,比如通常的二分类,多分类。1、数学知识:贝叶斯定理:特征条件独立:1、朴素贝叶斯输入空间:输出空间:y={C1,C2,…,CK}。训练集:T={(x1,y1),(x2,y2),…,(xN,yN)}。对于每个实例,其P(X,Y)独立同分布。在进行分类之前,需要先将计...
分类:
编程语言 时间:
2015-07-29 12:09:30
阅读次数:
1169
朴素贝叶斯算法与上篇中写到到生成学习算法的思想是一致的。它不需要像线性回归等算法一样去拟合各种假设的可能,只需要计算各种假设的概率,然后选择概率最高的那种假设分类类别。其中还添入了一个贝叶斯假定:在给定目标值y时属性值x之间相互独立。这样的分类算法被称为朴素贝叶斯分类器(Naive Bayes classifier) 。
1、朴素贝叶斯算法
在朴素贝叶斯算法的模型里,给定的训练集为,...
分类:
编程语言 时间:
2015-07-24 13:04:49
阅读次数:
215
朴素贝叶斯算法(Naive Bayes)阅读目录一、病人分类的例子二、朴素贝叶斯分类器的公式三、账号分类的例子四、性别分类的例子 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。回.....
分类:
编程语言 时间:
2015-07-21 07:52:40
阅读次数:
137
生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。一、病人分类的例子 让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。 某个医院早上收了六个门诊病人,如下表。 ...
分类:
编程语言 时间:
2015-07-20 09:15:02
阅读次数:
147
把(T为任意类型)关联起来,是很常见的需求。如笔者最近要做一个贝叶斯算法的垃圾邮件过滤器,就需要把每个单词与频率对应起来,做成一个表。而当单词很多时,对于每个单词做一遍O(N)的枚举,效率实在不尽人意。而下文讲到的一些关联容器或函数,都可以吧时间复杂度降至O(log2n)或更低。 本文对比4种...
分类:
编程语言 时间:
2015-07-07 08:14:01
阅读次数:
140
今天看了一下朴素贝叶斯算法。在看到如果样本的某个特征是连续属性的情况下,需要计算出在所有类别下该特征(该特征在不同类别下的)高斯分布,说白了就是求出来在某一类别下该特征的均值和标准差。那么,给某一个特征的值,在带入该特征在各类的概率密度函数(PDF),就可以得到书中所说的“后验概率”。
那么问题来了,对于离散属性的特征,这样是没有问题的。但是PDF某一点的值,大学学的知识说是没有意义的。求出一个...
分类:
其他好文 时间:
2015-07-06 12:29:03
阅读次数:
139
前言
一看到贝叶斯网络,马上让人联想到的是5个字,朴素贝叶斯,在所难免,NaiveByes的知名度确实会被贝叶斯网络算法更高一点。其实不管是朴素贝叶斯算法,还是今天我打算讲述的贝叶斯网络算法也罢,归根结底来说都是贝叶斯系列分类算法,他的核心思想就是基于概率学的知识进行分类判断,至于分类得到底准不准,大家尽可以自己用数据集去测试测试。OK,下面进入正题--贝叶斯网络算法。
朴素贝叶斯
一般我在...
分类:
其他好文 时间:
2015-06-29 20:35:18
阅读次数:
154
、 朴素贝叶斯算法 输入:训练数据T={(x1,y1),(x2,y2),…,(xN,yN)}, 输出:X的分类 计算先验概率及条件概率 计算朴素贝叶斯概率 选择概率最大的类 拉普拉斯平滑(Laplace smoothing) 朴素贝叶斯两大假设 条件独立假设用于分类的特...
分类:
其他好文 时间:
2015-06-08 23:19:16
阅读次数:
155