简介Naive和BayesNaive:假定向量中的所有特征是相互独立的
Bayes:面向的问题NB主要用于解决有监督分类问题。相比于其他模型,其具备简单(不需要复杂的迭代式参数估计,由此方便处理大数据)、可解释性强(生成模型)、效果佳的特点。目标针对二分类问题,利用训练集数据学习一个判断阈值α,对于新来的数据做判定,大于α的数据属于正类,小于α的数据属于负类。有监督分类中存在两大流派 diagno...
分类:
编程语言 时间:
2015-08-12 10:18:11
阅读次数:
206
c4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 。c4.5对ID3算法做了相对的改进。如下 1 采用信息增益率代替信息增益。因为使用信息增益时会偏向选取取值更多的属性。 2 在树的构造过程中进行剪枝 3 能够完成对连续属性的离散化处理 4 对不完整数据进行处理c...
分类:
编程语言 时间:
2015-08-08 11:56:25
阅读次数:
130
0 K-means算法简介K-means是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。算法过程如下:1)从N个文档随机选取K个文档作为质...
分类:
编程语言 时间:
2015-07-28 12:38:26
阅读次数:
271
Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Market Basket analysis...
分类:
编程语言 时间:
2015-07-03 13:59:10
阅读次数:
167
国际权威学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12本月十大评选经典的数据挖掘算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive...
分类:
编程语言 时间:
2015-06-23 15:09:58
阅读次数:
107
国际权威学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12本月十大评选经典的数据挖掘算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive...
分类:
编程语言 时间:
2015-06-22 19:11:57
阅读次数:
189
贝叶斯分类器 贝叶斯分类分类原则是一个对象的通过先验概率。贝叶斯后验概率公式后计算。也就是说,该对象属于一类的概率。选择具有最大后验概率的类作为对象的类属。现在更多的研究贝叶斯分类器,有四个,每间:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率凝视的有向...
分类:
编程语言 时间:
2015-06-20 09:06:07
阅读次数:
144
18大经典数据挖掘算法小结本文所有涉及到的数据挖掘代码的都放在了我的github上了。地址链接:https://github.com/linyiqun/DataMiningAlgorithm大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,...
分类:
编程语言 时间:
2015-06-15 20:28:53
阅读次数:
122
平台:linux(Shell)软件:Weka,SAS,Spss,R,IBM IM,Mathout语言:Java,Python,PHP,MapReduce编程,Ruby数据库:SQL,MySQL算法:数据挖掘算法,机器学习算法,搜索引擎(推荐算法,反作弊,排序)(备注:回归、决策树、SVM、朴素贝叶斯...
分类:
其他好文 时间:
2015-06-05 00:32:27
阅读次数:
168
自然界中任何一个带有位置信息的个体都能被抽象为一个空间点数据,“点”的模式在自然与社会经济中都是普遍存在的,对点数据的分析,主要分为两大类:
1、点数据本身模式的识别和探索。
2、通过点模式的显示的信息,进行进一步的预测和知识总结。...
分类:
其他好文 时间:
2015-05-30 13:38:51
阅读次数:
11412