一、概述 前两章我们要求分类器做出艰难决策,给出“该数据实例属于哪一类”这类问题的明确答案。不过,分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。 概率论是许多机器学习算法的基础,所以深刻理解这一主题就显得十分重要。第3章在计算特征值取某个值的概 ...
分类:
编程语言 时间:
2016-08-02 09:59:56
阅读次数:
396
参考文章:http://www.cnblogs.com/skyme/p/3564391.html ...
分类:
编程语言 时间:
2016-07-20 19:15:42
阅读次数:
165
一 引言 本程序是一个完整的机器学习过程,先编写基于python的爬虫脚本,爬取目标论坛网站的评论到本地存储,然后使用贝叶斯分类模型对评论进行分类,预测新 的评论是否为垃圾评论。如果遇到大数据量的问题,可以把贝叶斯算法写成mapreduce模式,map负责把数据集划分成键值对格式,类序号为key,属 ...
分类:
其他好文 时间:
2016-07-05 22:32:05
阅读次数:
450
朴素贝叶斯算法是基于贝叶斯定理的算法,贝叶斯定理如下: \[P(Y|X) = \frac{P(X,Y)}{P(X)} = \frac{P(Y) \cdot P(X|Y)}{P(X)}\] 朴素贝叶斯是这样执行的,假设 $X$ 为数据的特征 其中每一维度均可看做一个随机变量,即 $X_1= x_1,X ...
分类:
其他好文 时间:
2016-07-01 16:03:08
阅读次数:
128
本文将叙述朴素贝叶斯算法的来龙去脉,从数学推导到计算演练到编程实战文章内容有借鉴网络资料、李航《统计学习方法》、吴军《数学之美》加以整理及补充基础知识补充:
1、贝叶斯理论–吴军数学之美
http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/2、条件概率
3、联合分布
朴素贝叶斯算法
朴素贝叶斯法是基于贝叶斯定...
分类:
编程语言 时间:
2016-05-12 17:52:49
阅读次数:
486
朴素贝叶斯算法简单高效,在处理分类问题上,是应该首先考虑的方法之一。 1、准备知识 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。 这个定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B ...
分类:
编程语言 时间:
2016-05-02 19:49:59
阅读次数:
329
前面文章已经介绍了朴素贝叶斯算法的原理,这里基于NavieBayes算法对newsgroup文本进行分类测试。
文中代码参考:http://blog.csdn.net/jiangliqing1234/article/details/39642757
主要内容如下:
1、newsgroup数据集介绍
数据下载地址:http://download.csdn.net/detail/hjy...
分类:
其他好文 时间:
2016-03-29 10:58:41
阅读次数:
367
代码測试环境:Hadoop2.4+Mahout1.0前面博客:mahout贝叶斯算法开发思路(拓展篇)1和mahout贝叶斯算法开发思路(拓展篇)2 分析了Mahout中贝叶斯算法针对数值型数据的处理。在前面这两篇博客中并没有关于怎样分类不带标签的原始数据的处理。以下这篇博客就针对这种数据进行处理。
分类:
编程语言 时间:
2016-03-05 20:13:09
阅读次数:
298
http://www.crocro.cn/post/286.html 利用朴素贝叶斯算法进行分类-Java代码实现 鳄鱼 3个月前 (12-14) 分类:机器学习 阅读(44) 评论(0) Java package cn.crocro.classifier; import java.util.Arr
分类:
编程语言 时间:
2016-02-28 12:25:10
阅读次数:
189