1、J48原理 基于从上到下的策略,递归的分治策略,选择某个属性放置在根节点,为每个可能的属性值产生一个分支,将实例分成多个子集,每个子集对应一个根节点的分支,然后在每个分支上递归地重复这个过程。当所有实例有相同的分类时,停止。 问题:如何选择根节点属性,建立分支呢? 例如:weather.a...
分类:
其他好文 时间:
2015-05-23 14:03:41
阅读次数:
370
计数排序_COUNTINGSORT我们之前讲过四种基本的排序方法:《快速排序_QUICKSORT》:http://blog.csdn.net/ii1245712564/article/details/45749061
《堆排序_HEAPOSRT》http://blog.csdn.net/ii1245712564/article/details/45534625
《归并排序_MERGESORT》:...
分类:
编程语言 时间:
2015-05-16 16:37:43
阅读次数:
299
数据库:
派生属性:其值可以从一个相关属性和属性集的值派生得到的属性。
多值属性:指同时由多个值表示的属性。
数据挖掘:应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识。1,决策树。2,神经网络。3,遗传算法。4,关联规则挖掘算法。
数据挖掘的分析方法分4种:关联分析、序列模式分析、分类分析、聚类分析。
命名冲突:相同意义的属性,在不同的分E-R图上有不同的命名,或名称相...
分类:
数据库 时间:
2015-05-14 23:52:39
阅读次数:
247
1)决策树之ID3决策树算法是分类算法的一种,基础是ID3算法,C4.5、C5.0都是对ID3的改进。ID3算法的基本思想是,选择信息增益最大的属性作为当前的分类属性。看Tom M. Mitchell老师的《Machine Learing》第三章中的例子:我们先解释一下这张表,表中有14条实例数据,...
分类:
其他好文 时间:
2015-05-14 16:01:34
阅读次数:
2584
参考文献:http://www.cnblogs.com/xppei/p/3534719.html---C++实现http://blog.sina.com.cn/s/blog_5fc375650100jgxg.html---讲解熵、信心增量
分类:
其他好文 时间:
2015-05-13 17:06:20
阅读次数:
96
一、描述统计描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K...
分类:
其他好文 时间:
2015-05-12 00:02:56
阅读次数:
136
vi与Emacs的不同viEmacs快捷键命令vi通过记录按键序列,形成决策树中的一条路径,从而确定一个命令。Emacs通过组合键的方式立即执行命令。内存占用和定制性由于历史原因,vi小而快,但定制性上比较受限。Emacs启动慢且占用更多内存,但高度可定制,包含大量复杂功能。它基本上是一个Lisp程...
分类:
系统相关 时间:
2015-05-06 22:25:34
阅读次数:
227
一个弱分类器就是一个基本和上图类似的决策树,最基本的弱分类器只包含一个Haar-like特征,也就是它的决策树只有一层,被称为树桩(stump)。最重要的就是如何决定每个结点判断的输出,要比较输入图片的特征值和弱分类器中特征,一定需要一个阈值,当输入图片的特征值大于该阈值时才判定其为人脸。训练最优弱...
分类:
其他好文 时间:
2015-04-29 19:08:53
阅读次数:
136
引言 之前了解到决策树在选择最好的特征进行数据集的划分就说到这种方法可以用来进行特征选择,然后看了breiman主页上相关的介绍,觉得这不愧是权威啊,不愧是随机森林算法的提出者,讲的很清楚,网址如下 http://www.stat.berkeley.edu/~breiman/RandomForest...
分类:
其他好文 时间:
2015-04-28 22:32:08
阅读次数:
143