(这个系列的第一部分介绍了贝叶斯定理,第二部分介绍了如何过滤垃圾邮件,今天是第三部分。)使用Google的时候,如果你拼错一个单词,它会提醒你正确的拼法。比如,你不小心输入了seperate。Google告诉你,这个词是不存在的,正确的拼法是separate。这就叫做"拼写检查"(spelling ...
分类:
其他好文 时间:
2014-09-25 15:38:09
阅读次数:
325
贝叶斯统计是基于贝叶斯定理的一种经典的统计学习方法。假定样本为X,参数为θ,则贝叶斯统计为:P(θ|X)=P(X|θ)*P(θ)/P(X)。其中,P(θ)为先验分布,P(X|θ)表示似然概率,P(θ|X)表示后验分布。在贝叶斯统计中,最重要的一个问题是关于先验分布的选择,它会在很大程度上影响最终结果...
分类:
其他好文 时间:
2014-09-23 21:44:35
阅读次数:
177
这两天看了下朴素贝叶斯分类器,在这里根据自己的理解做个简单笔记,也顺便整理一下思路。 一、简介 1. 什么是朴素贝叶斯分类器? 朴素贝叶斯分类器是一种应用基于独立假设的贝叶斯定理的简单概率分类器。基于独立假设的意思是假设样本每个特征与其他特征都不相关,例如,一个物体具有颜色、大小、重量和材质等特征,...
分类:
其他好文 时间:
2014-08-17 14:16:12
阅读次数:
251
贝叶斯分类是统计学的一个分类方法,基于贝叶斯定理。首先贝叶斯分类的一个核心假设是一个属性值对给定类的影响独立于其他属性的值(类条件独立)。
先来看下条件概率:
设A、B是两个事件,且P(B)>0,则称 为在事件B发生的条件下,事件A的条件概率。
再来看一下贝叶斯定理:。
其中:
X 是类标识未知的数据样本(或数据元组)
如:35岁收入$4000的顾客
...
分类:
其他好文 时间:
2014-06-01 09:52:51
阅读次数:
235
1.算法简介
朴素贝叶斯(Naive Bayes)是无监督学习的一种常用算法,易于实现,没有迭代,并有坚实的数学理论(即贝叶斯定理)作为支撑。
本文以拼写检查作为例子,讲解Naive Bayes分类器是如何实现的。对于用户输入的一个单词(words),拼写检查试图推断出最有可能的那个正确单词(correct)。当然,输入的单词有可能本身就是正确的。比如,输入的单词thew,用户...
分类:
其他好文 时间:
2014-04-29 13:38:20
阅读次数:
476