CART算法原理与理解
CART算法的全称是分类回归树算法,分类即划分离散变量;回归划分连续变量。他与C4.5很相似,但是一个二元分类,采用的是类似于熵的GINI指数作为分类决策,形成决策树之后还要进行剪枝,我自己在实现整个算法的时候采用的是代价复杂度算法。
GINI指数
GINI指数主要是度量数据划分或训练数据集D的不纯度为主,系数值的属性作为测试属性,GINI值越小,表明样本的纯净度越高...
分类:
编程语言 时间:
2015-04-01 22:02:53
阅读次数:
324
1.样本类在类前面加入关键字case则该类就是样本类,样本类在实例化的时候,不用new关键字如下:case class A()object Hello extends App { val v = A //使用样本类之后 val b = new A}样本类的第二个好处是,他使你的类参数引式的获得...
参考:http://www.cnblogs.com/tornadomeet/archive/2012/03/15/2398769.html MeanShift 算法作为一种基于特征的跟踪方法,基本思想是通过反复迭代搜索特征空间中样本点最密集的区域,搜索点沿着样本点密度增加的方向“漂移”到局部密度.....
分类:
编程语言 时间:
2015-03-31 00:22:05
阅读次数:
181
Chandler,这个充满梦想,但是却变成泥潭的东西,在作者的眼中,已经成了一个警醒。没有目的,没有管理和约束,各种天马行空。与作者刚开始闲的不一样,本应该充满着团队意识,洋溢着积极色彩的东西,却变成了灰色。 项目所有的成员都应该尽可能地发挥自己的创造性,但是不加节制的创造只会带来不切实际的项目.....
分类:
其他好文 时间:
2015-03-30 20:57:18
阅读次数:
117
问题来源 在安装VS2013时,本来是勾选了个全部安装就没去管它了,过了一会一看,居然提示我是 .Net Framework 4.5.1 安装时遇到严重错误, 像这样 本以为是个很简单的问题,结果没想到折腾了一天,直到现在才解决,还是用的独家方法。 类似问题 在寻找答案的过程中,碰到类似的问题有:1...
分类:
Web程序 时间:
2015-03-30 06:43:55
阅读次数:
154
DeepLearningFaceRepresentationfromPredicting10,000Classes论文笔记(2015.03.24)一、基本思路 作者利用卷积神经网络(ConvolutionalNeuralNetwork,CNN)对大量样本进行训练,提取Deephiddenidenti...
分类:
其他好文 时间:
2015-03-28 11:30:07
阅读次数:
334
做个标记http://coolshell.cn/articles/9104.htmlsed全名叫stream editor,流编辑器,用程序的方式来编辑文本,相当的hacker啊。sed基本上就是玩正则模式匹配,所以,玩sed的人,正则表达式一般都比较强。同样,本篇文章不会说sed的全部东西,你可以...
分类:
其他好文 时间:
2015-03-28 10:03:36
阅读次数:
170
opencv 2 归一化函数normalize详解
1. 归一化定义与作用
归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保证程序运行时收敛加快。归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在某个区间上是统计的坐标分布。归一化有同一、统一和合一的意思。
归一...
分类:
其他好文 时间:
2015-03-28 08:48:56
阅读次数:
165
//k阶样本矩int varK(double* dList,int nCount,int k,double* pdRes){ if((NULL == dList) || (NULL == pdRes)) return -1; if(nDataCount10) return -4; ...
分类:
其他好文 时间:
2015-03-21 15:17:52
阅读次数:
81
正态分布数据检验-偏度峰度检验法正态数据偏度峰度检验法置信度:1-alpha数据样本数:nsig1=sqrt(6.0*(n-2)/(n+1)/(n+3));sig2=sqrt(24.0*n*(n-2)*(n-3)/(n+1)/(n+1)/(n+3)/(n+5));mu2=3.0-6.0/(n+1);...
分类:
其他好文 时间:
2015-03-21 14:02:27
阅读次数:
474