搜索关键字：随机森林，搜索到358个结果！码迷,mamicode.com！

Decision_function：scores，predict以及其他

机器学习的评估 PR曲线用于positive类数据占比比较小，或者你更加在意false postion（相比于false negative）；其他情况采用ROC曲线；比如Demo中手写体5的判断，因为只有少量5，所以从ROC上面来看分类效果不错，但是从PR曲线可以看到分类器效果不佳。 y_score... ...

分类：其他好文时间：2018-07-17 23:24:07 阅读次数：502

机器学习：逻辑回归（基础理解）

逻辑回归（Logistic Regression）一、行业算法应用率具统计，2017年，除了军事和安全领域，逻辑回归算法是在其它所有行业使用最多了一种机器学习算法； Logistic Regression（逻辑回归） Decision Trees（决策树） Random Forests（随机森林 ...

分类：其他好文时间：2018-07-15 12:04:52 阅读次数：231

Python机器学习之梯度提升树

#和随机森林一样，基于决策树，采用连续的方式构建树，深度很小max_depth<5.重要的参数n_estimate和learning_rate,这两个参数的y作用在于对模型过拟合化得调整，从而提高模型得泛化能力。 from sklearn.ensemble import GradientBoosti ...

分类：编程语言时间：2018-07-14 19:26:44 阅读次数：533

Ensemble methods 之 Random Forest（随机森林)（收藏）

1. 是什么如前面所说，决策树有时候会出现过拟合（overfit）的问题，越强大的决策树越可能出现过拟合，但是如果几个模型或者一个模型的几个参数组合起来，就很容易弥补这种问题。 2. 关键概念采样。样本数量为N，采样数量也为N，但是采取的是有放回的采样（bootstrap）。训练。决策树完全分 ...

分类：其他好文时间：2018-07-12 13:19:05 阅读次数：184

6.集成算法boosting----AdaBoost算法

1.提升算法提升算法实为将一系列单一算法（如决策树，SVM等）单一算法组合在一起使得模型的准确率更高。这里先介绍两种Bagging(代表算法随机森林），Boosting（代表算法AdaBoost-即本篇核心） Bagging思想：以随机森林为例假设样本集的总样本量为100个，每个样本有10个特征 ...

分类：编程语言时间：2018-07-06 13:06:39 阅读次数：200

2018年某学院最新人工智能机器学习升级版视频教程

百度云盘下载==========课程目录==============└─视频01数学分析与概率论.mp402数理统计与参数估计.avi03矩阵和线性代数.avi04凸优化.avi05Python库.avi06Python库II.mp407回归.mp408回归实践.mp409决策树和随机森林.avi10决策树和随机森林实践.mp411提升.mp412XGBoost实践.mp413SVM.mp414S

分类：其他好文时间：2018-07-05 17:26:35 阅读次数：207

随机森林

定义：随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定建树过程： ...

分类：其他好文时间：2018-07-02 13:32:52 阅读次数：197

xgboost使用

xgboost的实现方式为多颗CART树，其实xgboost就是类似于随机森林，但是与随机森林不同，他不是多个子树决策的结果，CART树最后会算出一个得分，是一个值，最后算出分类的时候，是多个值结合在一起用一个式子算出分类的。这里只记录xgboost的使用方式： ...

分类：其他好文时间：2018-06-28 22:58:44 阅读次数：229

机器学习（十一）—常用机器学习算法优缺点对比、适用条件

1、决策树适用条件：数据不同类边界是非线性的，并且通过不断将特征空间切分为矩阵来模拟。特征之间有一定的相关性。特征取值的数目应该差不多，因为信息增益偏向于更多数值的特征。优点：1.直观的决策规则；2.可以处理非线性特征；3.考虑了变量之间的相互作用。缺点：1.容易过拟合（随机森林、剪枝）；2. ...

分类：编程语言时间：2018-06-19 13:50:46 阅读次数：326

用R处理不平衡的数据

欢迎大家前往 "腾讯云+社区" ，获取更多腾讯海量技术实践干货哦~ 本文来自 "云+社区翻译社" ，作者 "ArrayZoneYour" 在分类问题当中，数据不平衡是指样本中某一类的样本数远大于其他的类别样本数。相比于多分类问题，样本不平衡的问题在二分类问题中的出现频率更高。举例来说，在银行或者金融 ...

分类：其他好文时间：2018-06-18 12:40:05 阅读次数：296

共358条上一页 1 ... 14 15 16 17 18 ... 36 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)