一棵决策树包含一个根结点、若干内部结点和若干个叶节点;叶结点对应决策结果,其他每个结点则对应于一个属性测试;每个结点包含的样本集合根据属性测试的结果被划分到子结点中;根结点包含样本全集。从根结点到每个叶结点的路径对应一个判定测试序列。决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决 ...
分类:
其他好文 时间:
2020-04-28 15:31:47
阅读次数:
86
1 简介 1.1 介绍 1.2 生成步骤 CART树算法由以下两步组成:(1)决策树生成:基于训练数据集生成决策树,生成的决策树要尽量大;(2)决策树剪枝:用验证数据集对己生成的树进行剪枝并选择最优子树,这时用损失函数址小作为剪枝的标准。 2 算法 2.1 回归树 对回归树用平方误差最小化准则,生成 ...
分类:
编程语言 时间:
2020-04-28 14:36:46
阅读次数:
113
1 简介 决策树模型是树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策 ...
分类:
其他好文 时间:
2020-04-28 13:04:22
阅读次数:
158
条件概率 是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A|B),读作“在B的条件下A的概率”。条件概率可以用决策树进行计算。条件概率的谬论是假设 P(A|B) 大致等于 P(B|A)。条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A|B) ...
分类:
其他好文 时间:
2020-04-28 09:17:04
阅读次数:
88
随机森林,是指用随机的方式建立一个森林,森林里面有许多决策树,且随机森林中的树与树之间是彼此独立的。在得到随机森林后,当有一个新的样本输入的时候,让森林中的每一棵树分别进行计算并进行统计汇总,得分最多的那个结果为最终的结果。随机森林既可以处理属性为离散值的样本(ID3算法),也可以处理属性为连续值的 ...
分类:
其他好文 时间:
2020-04-23 00:41:07
阅读次数:
102
1. 什么是决策树 1.1 决策树的基本思想 其实用一下图片能更好的理解LR模型和决策树模型算法的根本区别,我们可以思考一下一个决策问题:是否去相亲,一个女孩的母亲要给这个女海介绍对象。 大家都看得很明白了吧!LR模型是一股脑儿的把所有特征塞入学习,而决策树更像是编程语言中的if-else一样,去做 ...
分类:
其他好文 时间:
2020-04-20 16:15:14
阅读次数:
146
importpandasaspdimportnumpyasnpdata=pd.read_excel(r‘/Users/fangluping/Desktop/望潮府.xlsx‘,encoding=‘utf_8_sig‘,usecols=[‘销售状态‘,‘产品类型‘,‘户型‘,‘户型配置‘,‘预测建筑面积‘,‘表价总价‘,‘建面表单价‘,‘价格方案名称‘,‘调价幅度(%)‘],skipfooter=1
分类:
其他好文 时间:
2020-04-19 00:57:27
阅读次数:
64
想必很多人都听说过决策树和随机森林,这是用来预测的数学模型,用python可以快速实现。下面这些代码请收好,理解其中的含义以后,改改参数你也可以用这个模型进行预测啦。不过博主以为,模型最后的寻找重要因子才是最有意思的部分~拿到数据集的第一步,清洗数据:importpandasaspdimportnumpyasnptitanic=pd.read_csv(r‘/Users/titanic_train.
分类:
其他好文 时间:
2020-04-18 16:04:09
阅读次数:
114
堆排序,快速排序的时间复杂度为nlog(n)。他们都是运用比较排序的结果。好比决策树模型。 属于线性时间排序的算法有:计数排序,基数排序和桶排序。 计数排序: 先分别求出每个元素的频数,不过如果元素值较大时,比较浪费内存空间。 def Counting_Sort(A,B,k): for i in r ...
分类:
编程语言 时间:
2020-04-17 21:52:51
阅读次数:
68