coding: utf 8 """ Created on Tue Aug 14 17:36:57 2018 @author: weixw """ import numpy as np 定义树结构,采用的二叉树,左子树:条件为true,右子树:条件为false leftBranch:左子树结点 rig ...
分类:
其他好文 时间:
2019-11-06 00:59:43
阅读次数:
117
问题描述: 在一段spark机器学习的程序中,同时用到了Filter算子和StringIndexer算子,其中StringIndexer在前,filter在后,并且filter是对stringindexer的输出列设置了过滤条件,filter算子之后将数据集灌到随机森林中(试过决策树分类和逻辑回归同 ...
分类:
其他好文 时间:
2019-11-05 13:16:49
阅读次数:
96
python分类预测模型的特点 模型 模型特点 位于 SVM 强大的模型,可以用来回归,预测,分类等,而根据选取不同的和函数,模型可以是线性的/非线性的 sklearn.svm 决策树 基于"分类讨论,逐步细化"思想的分类模型,模型直观,易解释 sklearn.tree 朴素贝叶斯 基于概率思想的简 ...
分类:
编程语言 时间:
2019-11-03 14:59:46
阅读次数:
141
上一篇博客中介绍了ID3和C4.5两种决策树算法,这两种决策树都只能用于分类问题,而本文要说的CART(classification and regression tree)决策树不仅能用于分类问题,也能用于回归问题。 ...
分类:
编程语言 时间:
2019-11-01 09:56:25
阅读次数:
87
主要内容: 1.模型介绍 提升树算法与线性回归模型的思想类似,所不同的是该算法实现了多棵基础决策树𝑓(𝑥)的加权运算,最具代表的提升树为AdaBoost算法,即 2.损失函数的介绍 对于Adaboost算法而言,每一棵基础决策树都是基于前一棵基础决策树的分类结果对样本点设置不同的权重,如果在前一 ...
分类:
编程语言 时间:
2019-10-31 20:07:33
阅读次数:
154
sklearn监督学习的各个模块 neighbors近邻算法,svm支持向量机,kernal_ridge核岭回归,discriminant_analysis判别分析,linear_model广义线性模型 ensemble集成方法,tree决策树,native_bayes朴素贝叶斯,cross_dec ...
分类:
编程语言 时间:
2019-10-31 17:52:59
阅读次数:
98
是基本算法,和决策树一样,是树模型中的基础算法,朴素贝叶斯是贝叶斯中的一个算法,是基于统计学的,在文本处理领域应用广泛。 需要先掌握贝叶斯定理: 联合概率(两个事件同时发生的概率) 条件概率(事件A发生的情况下,B的概率)= AB的联合概率/A发生的概率 乘法公式:条件概率变形 联合概率—天剑概率— ...
分类:
其他好文 时间:
2019-10-30 18:15:05
阅读次数:
69
决策树: 决策树方法在分类,预测,规则等领域有这广泛的应用,20世纪70年代后期和80年代初期,机器学习研究者提出了ID3算法后,决策树在机器学习,数据挖掘领域取得极大的发展,后来又有了c4.5,成为新的监督学习算法.1984年,几位科学家提出了CART分类算法,ID3和CART算法同时被提出,但都 ...
分类:
其他好文 时间:
2019-10-28 21:12:11
阅读次数:
111
决策树: 使用决策树算法,我们从树根开始,基于可获得最大信息增益(information gain,IG)的特征来对数据进行划分,我们将在下一节详细介绍信息增益的概念。 通过迭代处理,在每个子节点上重复此划分过程,直到叶子节点。这意味着在每一个节点处,所有的样本都属于同一类别。 在实际应用中,这可能 ...
分类:
编程语言 时间:
2019-10-19 10:01:54
阅读次数:
106
在集成学习(一)中介绍过,Bagging(bootstrap aggregation)是一种增强模型多样性,降低方差的有效手段,特别适用于高方差,低偏差的模型,例如决策树,注意到Bagging也是一种可并行模型,而Boosting是一种顺序模型,是一类由弱学习器提升到强学习器的算法。注意到,对于绝大 ...
分类:
其他好文 时间:
2019-10-17 01:18:23
阅读次数:
151