1 简介 1.1 介绍 1.2 生成步骤 CART树算法由以下两步组成:(1)决策树生成:基于训练数据集生成决策树,生成的决策树要尽量大;(2)决策树剪枝:用验证数据集对己生成的树进行剪枝并选择最优子树,这时用损失函数址小作为剪枝的标准。 2 算法 2.1 回归树 对回归树用平方误差最小化准则,生成 ...
分类:
编程语言 时间:
2020-04-28 14:36:46
阅读次数:
113
一、用自己的话描述出其本身的含义: 1、特征选择 是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。 2、PCA 主成分分析 ,是一种掌握事物主要矛盾的统计分析方 ...
分类:
其他好文 时间:
2020-04-28 12:58:30
阅读次数:
68
一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后。可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。 2、PCA 它是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原 ...
分类:
其他好文 时间:
2020-04-28 09:32:16
阅读次数:
53
一、用自己的话描述出其本身的含义: 1、特征选择 将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 找出数据里最主要的方面,用数据里最主要的方面来代替原始数据 二、并用自己的话阐述出两者的主要区别 PCA是用于 ...
分类:
其他好文 时间:
2020-04-27 22:44:45
阅读次数:
56
一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后 可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。 2、PCA PCA是一种分析、简化数据集的技术,主要是将数据的主成分(包含信息量 ...
分类:
其他好文 时间:
2020-04-27 19:31:34
阅读次数:
47
一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 答:特征选择:选择部分特征当做机器学习的相关数据。 PCA:PCA是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原数据的维数(复杂度),损失少量信息,可以消减回归分析或聚类分析中特征的数量。 二、并用自己的话阐述出两者的 ...
分类:
其他好文 时间:
2020-04-27 19:06:50
阅读次数:
48
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 代码: from sklearn.f ...
分类:
其他好文 时间:
2020-04-27 17:53:38
阅读次数:
37
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 ...
分类:
其他好文 时间:
2020-04-27 17:37:33
阅读次数:
39
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu ...
分类:
其他好文 时间:
2020-04-27 15:50:30
阅读次数:
53
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre ...
分类:
其他好文 时间:
2020-04-27 15:42:02
阅读次数:
55