该系列来自于我《人工智能》课程回顾总结,以及实验的一部分进行了总结学习机垃圾分类是有监督的学习分类最经典的案例,本文首先回顾了概率论的基本知识、则以及朴素贝叶斯模型的思想。最后给出了垃圾邮件分类在Matlab中用朴素贝叶斯模型的实现1.概率1.1 条件概率定义:事件B发生的情况下,事...
分类:
其他好文 时间:
2015-09-18 20:18:07
阅读次数:
387
K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签....
分类:
编程语言 时间:
2015-09-17 11:44:08
阅读次数:
255
importnumpyasnp
#返回样本数据集
defloadDataSet():
postingList=[[‘my‘,‘dog‘,‘has‘,‘flea‘,‘problems‘,‘help‘,‘please‘],
[‘maybe‘,‘not‘,‘take‘,‘him‘,‘to‘,‘dog‘,‘park‘,‘stupid‘],
[‘my‘,‘dalmation‘,‘is‘,‘so‘,‘cute‘,‘I‘,‘love‘,‘him‘],
[‘stop‘,‘posting‘,‘stupid‘,..
分类:
编程语言 时间:
2015-09-16 01:02:17
阅读次数:
228
概率是许多机器学习算法的基础,在前面生成决策树的过程中使用了一小部分关于概率的知识,即统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,得到特征取该值的概率。之前的基础实验中简单实现了朴素贝叶斯分类器,并正确执行了文本分类,这一节将贝叶斯运用到实际场景,垃圾邮件过滤这一实际应用。...
分类:
其他好文 时间:
2015-09-15 00:18:48
阅读次数:
232
注意:1、代码中的注释请不要放在源程序中运行,会报错。2、代码中的数据集来源于http://archive.ics.uci.edu/ml/datasets/Car+Evaluation3、对于朴素贝叶斯的原理,可以查看我的前面的博客#Author:WenxiangCui
#Date:2015/9/11
#Function:AclassifierwhichusingnaiveBayesiana..
分类:
编程语言 时间:
2015-09-14 00:44:27
阅读次数:
234
概率是许多机器学习算法的基础,在前面生成决策树的过程中使用了一小部分关于概率的知识,即统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,得到特征取该值的概率。...
分类:
其他好文 时间:
2015-09-12 00:52:33
阅读次数:
222
朴素贝叶斯分类器是基于贝叶斯理论中属性独立假设而创造的一种算法。算法思路简单:只要是哪个类的后验概率大待测样本即为该类别。所谓后验概率就是在给定条件发生的情况下,该样本被判定为某个类别的概率。后验概率P(Y|X)表示在属性集合X(X1,X2,...,Xn)发生的条件下Y类别发..
分类:
编程语言 时间:
2015-09-08 20:22:07
阅读次数:
249
本文在对朴素贝叶斯分类进行了简单介绍之后,用Python编程实现。
分类:
其他好文 时间:
2015-09-02 22:02:49
阅读次数:
201
转载请注明出处:http://www.cnblogs.com/marc01in/p/4775440.html引和师弟师妹聊天时经常提及,若有志于从事数据挖掘、机器学习方面的工作,在大学阶段就要把基础知识都带上。机器学习在大数据浪潮中逐渐展示她的魅力,其实《概率论》、《微积分》、《线性代数》、《运筹学...
分类:
编程语言 时间:
2015-09-01 14:00:54
阅读次数:
634
需要知道的是在什么时候可以用朴素贝叶斯算法:需要保证特征条件独立。 主要过程是学习输入和输出的联合概率分布。 预测的时候,就可以根据输入获得对打后验概率对应的输出y。 先验概率:已知输出,求输入。后验概率相反。 简单来说朴素贝叶斯算法,就是在对样本进行学习之后,到了需要做决策的时候,给定...
分类:
编程语言 时间:
2015-08-28 22:54:41
阅读次数:
285