贝叶斯公式描述的是一组条件概率之间相互转化的关系。
在机器学习中,贝叶斯公式可以应用在分类问题上。这篇文章是基于自己的学习所整理,并利用一个垃圾邮件分类的例子来加深对于理论的理解。
这里我们来解释一下朴素这个词的含义:
1)各个特征是相互独立的,各个特征出现与其出现的顺序无关;
2)各个特征地位同等重要;
以上都是比较强的假设
下面是朴素贝叶斯分类的流程:...
分类:
其他好文 时间:
2014-10-09 21:39:17
阅读次数:
205
题目大意:有一些商品需要被制造,有一些员工,每一个员工会做一些物品,然而这些员工做物品越多,他们的愤怒值越大,这满足一个分段函数。给出哪些员工可以做哪些东西,给出这些分段函数,求最小的愤怒值以满足需要被制造的商品。
思路:费用流。我写的朴素费用流好像很慢,有时间学一学费用流的多路增广。
由于题目中满足那些分段函数是满足单调递增的性质的,所以就可以如下建图:
S->每个人,费用0,流量...
分类:
其他好文 时间:
2014-10-09 19:45:57
阅读次数:
191
本节介绍Knuth-Morris-Pratt字符串匹配算法(简称KMP算法)。该算法最主要是构造出模式串pat的前缀和后缀的最大相同字符串长度数组next,和前面介绍的《朴素字符串匹配算法》不同,朴素算法是当遇到不匹配字符时,向后移动一位继续匹配,而KMP算法是当遇到不匹配字符时,不是简单的向后移一位字符,而是根据前面已匹配的字符数和模式串前缀和后缀的最大相同字符串长度数组next的元素来确定向后移动的位数,所以KMP算法的时间复杂度比朴素算法的要少,并且是线性时间复杂度,即预处理时间复杂度是O(m),匹配...
分类:
其他好文 时间:
2014-10-09 16:36:14
阅读次数:
176
这两天学习了一个相对比较简单但是十分实用的分类算法——贝叶斯分类算法,与我做项目使用的svm算法相比确实有很多精妙之处,。好比撒尿牛丸——好吃又好玩,而贝叶斯分类器则是简单又强大。本文结合简单天气预报进行讲解。
贝叶斯定理:
贝叶斯定理是概率论里面一个计算条件概率的法器!为什么是法器,且看后文。先摆出计算公式:
也许乍一看这公式没什么,但是我们先将公式移项得:P(A|B)P(B)=P...
分类:
其他好文 时间:
2014-10-09 16:31:18
阅读次数:
274
原文 http://www.nowamagic.net/librarys/eight/posts/2682这篇小文章朴素动人,是卓别林先生在七十岁生日时所作。当我真正开始爱自己,我才认识到,所有的痛苦和情感的折磨,都只是提醒我:活着,不要违背自己的本心。今天我明白了,这叫做真实。 当我真正开始爱自己...
分类:
其他好文 时间:
2014-10-09 01:39:27
阅读次数:
155
考虑用机器学习建立一个邮件过滤系统,来将邮件分成垃圾邮件和非垃圾邮件。首先我们建立一个词典,里面包含了邮件中所有的不重复单词。我们用长度为词典中单词数目的特征向量来表示一封邮件。如下所示:表示一封邮件,如果该邮件包含有词典中的第i个单词,那么,否则.为了建模,作一个很强的假设,假设词典中的每个单词是...
分类:
其他好文 时间:
2014-10-08 01:25:54
阅读次数:
385
分割原理的具体描述如下:1)把一个物体分成相互独立的几个部分;2)把一个物体分成容易组装和拆卸的部分;3)提高系统的可分性,以实现系统的改造。分割原理要表达的其实就是我们平常所说的分而治之的策略,这是我们解决问题的一种最简单朴素的方法,应用非常广泛。分割原理好处:A)降低系统的规模和粒度,增加系统的可解析降低系统规模和粒度的目的当然可以使得系统求解更加容易,对于制造业来说,可以使得制造更加容易,更...
分类:
其他好文 时间:
2014-10-07 12:10:43
阅读次数:
277
python提供了很多数据结构,不过其很多操作都是朴素操作,速度慢时间复杂度参见:https://wiki.python.org/moin/TimeComplexity可遍历(for): list, string, 判断元素是否存在(in): list, string, tuple合并: list,...
分类:
编程语言 时间:
2014-10-05 22:52:38
阅读次数:
344
安装package: > install.packages("e1071") 导入e1071: > library(e1071) 找一个数据集: > data(iris)
> iris
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 ...
分类:
其他好文 时间:
2014-10-05 01:15:57
阅读次数:
262
解决字符串匹配的算法包括朴素算法(Naive)、Rabin-Karp算法、有限自动机算法(Finite Automation)和 Knuth-Morris-Pratt 算法(即 KMP 算法)等,本文主要介绍 Naive 算法和 KMP 算法的基本原理和实现。
分类:
其他好文 时间:
2014-10-04 23:42:17
阅读次数:
569