背景&目标: 1、sport.tar 是体育类的文章,一共同拥有10个类别。 用这些原始材料构造一个体育类的文本分类器,并測试对照bayes和cbayes的效果; 记录分类器的构造过程和測试结果。 2、user-sport.tar 是用户浏览的文章,每一个目录相应一个用户。 利用上题构造的文本分类器 ...
分类:
其他好文 时间:
2017-04-25 19:18:40
阅读次数:
299
作者:桂。 时间:2017-04-20 18:31:37 链接:http://www.cnblogs.com/xingshansi/p/6740308.html 前言 本文为《统计学习方法》第四章:朴素贝叶斯(naive bayes),主要是借助先验知识+统计估计,本文主要论述其分类的思路。全文包括 ...
分类:
其他好文 时间:
2017-04-20 20:44:13
阅读次数:
284
吻合度蛮高,但不光滑。 API DOC: https://stat.ethz.ch/R-manual/R-devel/library/stats/html/density.html 参见: http://blog.csdn.net/yuanxing14/article/details/4194848 ...
分类:
其他好文 时间:
2017-04-06 09:54:05
阅读次数:
222
gibbs采样关键字一关键字二参数估计与预测机器学习的一般思路为:1.从问题的本质中构建模型,定义样本的产生,有联合概率(图模型)。2.进行模型参数的估计:MLE、MAP、Bayes。3.使用模型对新样本进行估计。MLE:极大似然估计估计:解优化函数预测:MAP:极大后验估计估计:解优化函数预测:对... ...
分类:
其他好文 时间:
2017-03-30 19:21:03
阅读次数:
221
https://en.wikipedia.org/wiki/Bayes'_theorem For example, if cancer is related to age, then, using Bayes’ theorem, a person’s age (prior knowledge) ca ...
分类:
其他好文 时间:
2016-11-29 14:14:31
阅读次数:
171
前言 本篇继续我们的微软挖掘算法系列总结,前几篇我们分别介绍了:微软数据挖掘算法:Microsoft 决策树分析算法(1)、微软数据挖掘算法:Microsoft 聚类分析算法(2)、微软数据挖掘算法:Microsoft Naive Bayes 算法(3)、微软数据挖掘算法:Microsoft 时序算 ...
分类:
编程语言 时间:
2016-11-14 09:38:26
阅读次数:
350
前言 本篇文章同样是继续微软系列挖掘算法总结,前几篇主要是基于状态离散值或连续值进行推测和预测,所用的算法主要是三种:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇,所涉及的应用场景在前几篇文章中也有 ...
分类:
编程语言 时间:
2016-11-12 16:25:37
阅读次数:
331
本文原文地址:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(结果预测篇) 前言 本篇文章主要是继续前几篇微软数据挖掘算法:Microsoft 决策树分析算法(1)、微软数据挖掘算法:Microsoft 聚类分析算法(2)、微软数据挖掘算法:Microsoft Naive Bayes 算法 ...
分类:
编程语言 时间:
2016-11-12 09:33:06
阅读次数:
304
转载:http://www.cnblogs.com/zhijianliutang/p/4016309.html 前言 本篇文章主要是继续前几篇Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,算法介绍后,经过这几种算法综合挖掘和分析之 ...
分类:
数据库 时间:
2016-11-05 17:52:57
阅读次数:
257
转载:http://www.cnblogs.com/zhijianliutang/p/4030742.html 前言 本篇继续我们的微软挖掘算法系列总结,前几篇我们分别介绍了:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法、Micr ...
分类:
数据库 时间:
2016-11-05 17:18:36
阅读次数:
184