朴素贝叶斯是一个很不错的分类器,在使用朴素贝叶斯分类器划分邮件有关于朴素贝叶斯的简单介绍。若一个样本有n个特征,分别用x1,x2,...,xn表示,将其划分到类yk的可能性P(yk|x1,x2,...,xn)为:P(yk|x1,x2,...,xn)=P(yk)∏ni=1P(xi|yk)上式中等号右侧...
分类:
其他好文 时间:
2015-08-26 15:24:29
阅读次数:
188
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。,对于给定的训练数据集,首先基于特征条件独立假设学习输入与输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y,朴素贝叶斯方法实现简单,学习与预测的效率都很高,是一种常用的方法。下面主要说一下朴素贝叶斯的...
分类:
其他好文 时间:
2015-08-18 17:59:14
阅读次数:
271
接着上一篇的继续来写。朴素贝叶斯法分类时,对给定的输入x,通过学习得到的模型计算后验概率分布P(Y=ck|X=x),然后将后验概率最大的类作为x的类输出。后验概率计算根据贝叶斯定理进行:P(Y=ck|X=x)=P(X=x|Y=ck)*P(Y=ck)/(sum (k)P(X=x|Y=ck)*P(Y=c...
分类:
其他好文 时间:
2015-08-18 17:57:52
阅读次数:
126
贝叶斯在1763年,《机会学说中一个问题的解》中提出了贝叶斯定理。生活中不乏分类,比如我们经常通过一些人的衣着,来下意识的区别某些人是杀马特亦或是文艺青年。我们是如何做出这些判断或者说是分类的呢?这些判断大多来自我们的“经验之谈”,即,我们首先脑海中会先存有“某类人通常会如何着装打扮”的概念,然后当...
分类:
编程语言 时间:
2015-08-12 18:51:10
阅读次数:
154
NLTK是Python的一个自然语言处理的模块,其中实现了朴素贝叶斯分类算法。以下,就使用上一篇文中提到的数据,来应用这个模块实现朴素贝叶斯分类。NLTK的实现更加泛化,所以在应用到我们的数据上时需要做一点的转化。
首先来看一下NLTK官方文档中给出的一个简单明了的例子,在了解这个例子之后,再设法将同样的模型应用到自己的数据集上。官方给出的例子是英文名中,在知道名字中最后一个字母后,判断...
分类:
其他好文 时间:
2015-08-10 20:10:15
阅读次数:
651
贝叶斯公式是一个很好的工具。理解贝叶斯需要复习一下条件概率:P(A|B)叫做B发生的条件下,A发生的概率。P(AB)叫做AB同时发生的概率。P(A|B) = P(AB)/P(B)
分类:
其他好文 时间:
2015-08-07 12:52:40
阅读次数:
97
这篇是计算机类的优质预售推荐>>>>《机器学习实践
测试驱动的开发方法》
用测试驱动方法开发出可靠、稳定的机器学习算法。
编辑推荐
本书介绍在开发机器学习算法时如何运用测试驱动的方法,捕捉可能扰乱正常分析的错误。这本实践指南从测试驱动开发和机器学习的基本原理讲起,展示了如何将测试驱动开发运用于若干机器学习算法,包括朴素贝叶斯分类器和神经网络。
任何机器学习算法都有...
分类:
其他好文 时间:
2015-08-06 16:58:01
阅读次数:
137
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类,而朴素贝叶斯分类可谓是里面最简单、入门的一种。首先关于贝叶斯定理,感觉简单而伟大,前些天一直在看吴军的数学之美(没看过的极力推荐)系列文章,看到自然语言处理从规则模型到统计模型转变的时候,语言的识别准确率上升好几个等级,以至于今天的语言识别到达很强大的地步,同时对于搜索引擎,网页搜索的准确率,也上升好多。这其中的最最重...
分类:
编程语言 时间:
2015-08-05 12:51:53
阅读次数:
250
假设现在要构建一个网络图书馆,我们可以给新进来的书贴上若干个标签,没有机器学习算法的情况下,我们需要给这些书手动分类,是计算机类的呀,还是非计算机类的呀,是小说类的呀,还是非小说类的云云。
那么,我们可以通过让程序自己学习如何通过一本书上的若干标签来进行图书类别的区分,这样就可以节省很多人力,这也是机器学习的魅力体现。
机器学习的基本原理是通过开发者给出这个程序一个学习集进行学习,再通过用户给的...
分类:
其他好文 时间:
2015-08-02 20:10:29
阅读次数:
170
从本质上来说,这是一个分类问题,类似于通过邮件内容来推测垃圾邮件,通过用户的相关信息来推测用户是否会拖欠贷款,而通过用户的APP安装列表来推测用户的性别也是一个类似的问题。
对于贝叶斯算法来首,我们首先需要一个训练集数据,这个训练集是一个已经打好标签的数据。而要对一堆的数据打标签,人工来做是不太合适的,在这里需要结合人类与计算机各自的优势,来半自动化的识别出比较明显的有性别倾向的APP的...
分类:
移动开发 时间:
2015-07-31 16:24:08
阅读次数:
194