理论 什么是朴素贝叶斯算法? 朴素贝叶斯分类器是一种基于贝叶斯定理的弱分类器,所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关。举个例子,如果一种水果其具有红,圆,直径大概3英寸等特征,该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属性 ...
分类:
编程语言 时间:
2018-07-07 20:41:29
阅读次数:
197
(如何建立一个文档分类系统,用于垃圾邮件过滤,或是根据关键字的模糊搜索来对一组文档进行划分) 贝叶斯分类器一般用于关于文档处理,但实际上也可以适用于任何其他形式的数据集,只要能将其转化成一组特征列表。所谓特征,就是指一个给定项中存在或缺少的某种东西。(在文档中,特征就是文档中的单词) *训练 利用样 ...
分类:
编程语言 时间:
2018-05-17 00:57:53
阅读次数:
210
使用python3 学习朴素贝叶斯分类api 设计到字符串提取特征向量 欢迎来到我的git下载源代码: https://github.com/linyi0604/kaggle ...
分类:
编程语言 时间:
2018-04-29 11:47:26
阅读次数:
224
此文旨在把trainNB0这个函数详细讲清楚。 下面把这个函数逐步分解: 1.参数 此函数的参数有两个,一个是trainMatrix,另一个是trainCategory,这两个参数是一步一步的数据处理产生的结果,过程如下: 1.1第一步 创建实验样本 这一句产生了listOPosts和listCla ...
分类:
其他好文 时间:
2018-02-25 19:19:03
阅读次数:
172
贝叶斯分类器是一个相当宽泛的定义,它背后的数学理论根基是相当出名的贝叶斯决策论。 贝叶斯学派 贝叶斯决策论是在概率框架下进行决策的基本方法之一,更是统计模式识别的主要方法之一。 贝叶斯学派与频率学派 贝叶斯决策论 参数估计 极大似然估计 极大后验概率估计 ...
分类:
其他好文 时间:
2018-02-11 00:10:07
阅读次数:
155
上一文介绍了K均值对股票K线分类,该文对它做一个应用,通过贝叶斯分类器进行股票走势的预测。好多炒股的大牛都说看K线判断次日的涨跌,按照这个思路,我们将前六根k线做为输入,涨幅超过2个点为1作为输出训练贝叶斯分类器,然后输入当日的前六根K线作为输入,来预测明日的股票走势。首先介绍一下贝叶斯分类器。贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,
分类:
其他好文 时间:
2018-01-17 10:10:28
阅读次数:
206
过去存在的问题: 界面不够美观 推荐不够人性化 代码不够符合开闭原则 我们已经做了哪些调整/改进: 本来想引入springAndroid,但看了下google的官方文档,不建议引入第三方框架;代码重构在进行中,在原本mvc模式的情况下会采用面向接口编程 我们设想用朴素贝叶斯分类器去解决推荐哪个的问题 ...
分类:
其他好文 时间:
2017-11-27 00:06:43
阅读次数:
167
贝叶斯分类器 什么是贝叶斯分类器 贝叶斯分类器是一类分类器的总称,这些分类器均以贝叶斯定理为基础,故统称为贝叶斯分类器。这些分类器中最简单的是朴素贝叶斯分类器,它几乎完全按照贝叶斯定理进行分类,因此我们从朴素贝叶斯分类器说起。 贝叶斯定理: 贝叶斯定理是概率论中一个比较重要的定理,在讲解贝叶斯定理之 ...
分类:
其他好文 时间:
2017-11-22 14:17:19
阅读次数:
158
Output: The error rate is: 0.1 背景:为什么要做平滑处理? 零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0。在文本分类的问题中,当一个词语没有在训练样本中出现,该词语调概率为0,使用连乘计算文本出现概率 ...
分类:
编程语言 时间:
2017-11-19 17:25:21
阅读次数:
162