决策树是通过一系列规则对数据进行分类的过程,他提供一种在什么条件下会得到什么值的类似规则方法,决策树分为分类树和回归树,分类树对离散变量最决策树,回归树对连续变量做决策树如果不考虑效率等,那么样本所有特征的判断级联起来终会将某一个样本分到一个类终止块上。实际上,样本所有特征中有一些特征在分类时起到决定性作用,决策树的构造过程就是找到这些具有决定性作用的特征,根据其决定性程度来构造一个倒立的树–决定性作用最大的那个特征作为根节点,然后递归找到各分支下子数据集中次大的决定性特征,直至子数据集中所有数据都属于同一...
分类:
编程语言 时间:
2016-04-26 19:51:35
阅读次数:
271
第一章 统计学习方法概论
统计学习的主要特点是:
(1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的;
(2)统计学习以数据为研究对象,是数据驱动的学科;
(3)统计学习的目的是对数据进行预测与分析;
(4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析;
(5)统计学习是概率论、统计学、信息论、计算理论、最...
分类:
其他好文 时间:
2016-03-30 13:20:02
阅读次数:
245
信息化是当代社会生产力发展和人类文明进步的强大动力,国家信息能力是国际竞争力的重要组成部分。关于信息的基本概念:控制论的创始人维纳认为:信息就是信息,既不是物质也不是能量。(第一次把信息与物质和能量相提并论)——客观角度信息论的奠基人香农认为:信息就是能够..
分类:
其他好文 时间:
2016-03-10 02:02:43
阅读次数:
321
第一次课程作业:梳理课程重点(信息基础+服务管理)第一章:信息化基础知识1.信息的概念(知道):有两个层次(1)本体论:你认为它是什么样就是什么样(2)信息论;由于我的认识不断深入,逐渐趋于它的本质2.国家信息化体系6要素,关系图要记住,某个要素是什么功能信息技术..
分类:
其他好文 时间:
2016-03-09 19:15:37
阅读次数:
407
图像处理数学方法在图像处理的发展过程中,数学始终起着举足轻重的作用,并渗透在图像处理的所有分支之中。到上世纪六七十年代为止,以Fourier分析为代表的线性处理方法占据了几乎整 个数字图像处理领域。在此期间,借助于随机过程理论,人们建立了图像模型通过概率论以及在此基础上建立的信息论建立了图像编码的框...
分类:
其他好文 时间:
2016-01-24 15:40:09
阅读次数:
249
帖子地址:http://www.g8f8.com/thread-21100-1-1.html论坛首页论坛首页是用户访问论坛时,进入到的第一个页面。它汇集了论坛分区、版块、子版块等核心元素,展示了论坛帖子和会员汇总信息、论坛公告、论坛热点、在线会员、友情链接等丰富信息,同时包含了首页右边栏和DIY等灵...
分类:
Web程序 时间:
2015-12-03 20:46:07
阅读次数:
323
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领域都有研究,例如博弈论、控制论、运筹学、信息论、模...
分类:
其他好文 时间:
2015-10-26 13:35:39
阅读次数:
349
本文简单介绍了熵、信息增益的概念,以及如何使用信息增益对监督学习的训练样本进行评估,评估每个字段的信息量。 1、熵的介绍 在信息论里面,熵是对不确定性的测量。通俗来讲,熵就是衡量随机变量随机性的指标。比如一个随机变量X的状态有{1,2,...,n},如果X取1的概率为1,其他状态为0,那么这个随机....
分类:
其他好文 时间:
2015-10-13 15:15:10
阅读次数:
268
基本概念 先说明一点:在信息论里面对数log默认都是指以2为底数。很多书籍资料都直接给出香农信息内容的公式,如公式(1)所示,可基本没有给出为什么是这样一种形式的合理化解释。在这里举个比较直白的例子。假设随...
分类:
其他好文 时间:
2015-10-07 06:27:40
阅读次数:
189
先说下我需要解决的场景是:主站http://h31bt.com需要调用论坛BBS的用户信息,而不是单独再建立一套用户信息,论坛的域名是bbs.h31bt.com,两个不在主机的同一文件目录下,所以需要解决跨域的问题,特此记录一下如何解决这方面的问题的。下面是我的一个解决办法,没有采用第三方的SDK的...
分类:
Web程序 时间:
2015-09-26 14:30:27
阅读次数:
180