码迷,mamicode.com
首页 >  
搜索关键字:决策树    ( 1280个结果
尚未整理【风控】互联网金融-构建评分卡模型部分知识点
①自变量不能相关,即排除自相关性,还有共线性;②变量一定要显著。③变量要独立同分布。 所以我们要进行共线性筛查,显著性筛查,相关性筛查,才能选择出入模变量。 9. 逻辑回归创建评分卡模型核心步骤: a) 变量分箱,可以排除异常值的影响,分法有等宽、等频、人工指定分箱、C4.5决策树、卡方分箱。 b) ...
分类:其他好文   时间:2019-07-15 01:36:27    阅读次数:194
sklearn之随机森林
''' 集合算法: 1.正向激励 2.自助聚合:每次从总样本矩阵中以有放回抽样的方式随机抽取部分样本构建决策树,这样形成多棵包含不同训练样本的决策树, 以削弱某些强势样本对模型预测结果的影响,提高模型的泛化特性。 3.随机森林:在自助聚合的基础上,每次构建决策树模型时,不仅随机选择部分样本,而且还随... ...
分类:其他好文   时间:2019-07-14 17:49:54    阅读次数:100
sklearn之决策树
''' 决策树: 基本算法原理: 核心思想:相似的输入必会产生相似的输出。例如预测某人薪资: 年龄:1-青年,2-中年,3-老年 学历:1-本科,2-硕士,3-博士 经历:1-出道,2-一般,3-老手,4-骨灰 性别:1-男性,2-女性 | 年龄 | 学历 | 经历 | 性别 | ==> | 薪资 ...
分类:其他好文   时间:2019-07-14 15:15:23    阅读次数:106
随机森林之oob的计算过程
随机森林有一个重要的优点就是,没有必要对它进行交叉验证或者用一个独立的测试集来获得误差的一个无偏估计。它可以在内部进行评估,也就是说在生成的过程中就可以对误差建立一个无偏估计。 随机森铃在生成每颗决策树时,会随机且有放回的抽取样本,每棵决策树会有大概1/3的样本未抽取到,这些样本就是每棵树的oob样 ...
分类:其他好文   时间:2019-07-08 13:36:02    阅读次数:398
机器学习之异常点检测
1.iForest(独立森林)算法 样本数据过大时推荐采用这种异常值检测方法 原理分析:iForest森林也由大量的树组成。iForest中的树叫isolation tree,简称iTree。iTree树和决策树不太一样,其构建过程也比决策树简单,因为其中就是一个完全随机的过程。具体实施过程如下:第 ...
分类:其他好文   时间:2019-07-02 18:59:03    阅读次数:150
机器学习与数据挖掘期末考试复习重点整理
分类: – 有类别标记信息, 因此是一种监督学习 – 根据训练样本获得分类器,然后把每个数据归结到某个已知的类,进而也可以预测未来数据的归类。 聚类: – 无类别标记, 因此是一种无监督学习 – 无类别标记样本,根据信息相似度原则进行聚类,通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布 ...
分类:其他好文   时间:2019-06-30 09:28:26    阅读次数:90
决策树(上)
1 特征选择 特征选择的理解:在决策树算法中,每次选择一个最优的特征来分支是最最重要的一步,那究竟如何选择这个最优的特征就变成了关键问题。对于拿到的数据中,什么类别标签的样本都有,是十分不确定的,换句话说就是十分混乱的。用数据中其中一个特征来划分数据之后,数据的混乱程度都会变小,最优的划分特征就是通 ...
分类:其他好文   时间:2019-06-27 16:26:54    阅读次数:168
python_机器学习_监督学习模型_决策树
1. 监督学习--分类 机器学习肿分类和预测算法的评估: a. 准确率 b.速度 c. 强壮行 d.可规模性 e. 可解释性 2. 什么是决策树/判定树(decision tree)? 3. 熵(entropy)概念: 变量的不确定越大,熵也就越大。 4. 决策树归纳算法(ID3) 5. 其他算法及 ...
分类:编程语言   时间:2019-06-25 11:57:46    阅读次数:191
kaggle1 - 决策树
pandas常用操作 data["name1"] 选择data中名字为: name1中的一列 # 数据预处理 data.dropna(axis=0) # 取出掉缺失值 按行 from sklearn.model_selection import train_test_split # Specify ...
分类:其他好文   时间:2019-06-23 21:01:14    阅读次数:132
aiops
智能运维用到的技术 1.数据聚合/关联技术概念聚类算法AOI分类算法K近邻/贝叶斯分类器/logistic回归(LR)/支持向量机(SVM)/随机森林(RF) 2.数据异常点检测技术独立森林算法 3.故障诊断和分析策略关联规则挖掘(Apriori算法/FP-growth算法)(有)决策树算法(迭代二 ...
分类:其他好文   时间:2019-06-19 16:43:16    阅读次数:137
1280条   上一页 1 ... 22 23 24 25 26 ... 128 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!