码迷,mamicode.com
首页 >  
搜索关键字:随机森林    ( 358个结果
Decision_function:scores,predict以及其他
机器学习的评估 PR曲线用于positive类数据占比比较小,或者你更加在意false postion(相比于false negative);其他情况采用ROC曲线;比如Demo中手写体5的判断,因为只有少量5,所以从ROC上面来看分类效果不错,但是从PR曲线可以看到分类器效果不佳。 y_score... ...
分类:其他好文   时间:2018-07-17 23:24:07    阅读次数:502
机器学习:逻辑回归(基础理解)
逻辑回归(Logistic Regression) 一、行业算法应用率 具统计,2017年,除了军事和安全领域,逻辑回归算法是在其它所有行业使用最多了一种机器学习算法; Logistic Regression(逻辑回归) Decision Trees(决策树) Random Forests(随机森林 ...
分类:其他好文   时间:2018-07-15 12:04:52    阅读次数:231
Python机器学习之梯度提升树
#和随机森林一样,基于决策树,采用连续的方式构建树,深度很小max_depth<5.重要的参数n_estimate和learning_rate,这两个参数的y作用在于对模型过拟合化得调整,从而提高模型得泛化能力。 from sklearn.ensemble import GradientBoosti ...
分类:编程语言   时间:2018-07-14 19:26:44    阅读次数:533
Ensemble methods 之 Random Forest(随机森林)(收藏)
1. 是什么 如前面所说,决策树有时候会出现过拟合(overfit)的问题,越强大的决策树越可能出现过拟合,但是如果几个模型或者一个模型的几个参数组合起来,就很容易弥补这种问题。 2. 关键概念 采样。样本数量为N,采样数量也为N,但是采取的是有放回的采样(bootstrap)。 训练。决策树完全分 ...
分类:其他好文   时间:2018-07-12 13:19:05    阅读次数:184
6.集成算法boosting----AdaBoost算法
1.提升算法 提升算法实为将一系列单一算法(如决策树,SVM等)单一算法组合在一起使得模型的准确率更高。这里先介绍两种Bagging(代表算法随机森林),Boosting(代表算法AdaBoost-即本篇核心) Bagging思想:以随机森林为例 假设样本集的总样本量为100个,每个样本有10个特征 ...
分类:编程语言   时间:2018-07-06 13:06:39    阅读次数:200
2018年某学院最新人工智能机器学习升级版视频教程
百度云盘下载==========课程目录==============└─视频01数学分析与概率论.mp402数理统计与参数估计.avi03矩阵和线性代数.avi04凸优化.avi05Python库.avi06Python库II.mp407回归.mp408回归实践.mp409决策树和随机森林.avi10决策树和随机森林实践.mp411提升.mp412XGBoost实践.mp413SVM.mp414S
分类:其他好文   时间:2018-07-05 17:26:35    阅读次数:207
随机森林
定义:随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定建树过程: ...
分类:其他好文   时间:2018-07-02 13:32:52    阅读次数:197
xgboost使用
xgboost的实现方式为多颗CART树,其实xgboost就是类似于随机森林,但是与随机森林不同,他不是多个子树决策的结果,CART树最后会算出一个得分,是一个值,最后算出分类的时候,是多个值结合在一起用一个式子算出分类的。 这里只记录xgboost的使用方式: ...
分类:其他好文   时间:2018-06-28 22:58:44    阅读次数:229
机器学习(十一)—常用机器学习算法优缺点对比、适用条件
1、决策树 适用条件:数据不同类边界是非线性的,并且通过不断将特征空间切分为矩阵来模拟。特征之间有一定的相关性。特征取值的数目应该差不多,因为信息增益偏向于更多数值的特征。 优点:1.直观的决策规则;2.可以处理非线性特征;3.考虑了变量之间的相互作用。 缺点:1.容易过拟合(随机森林、剪枝);2. ...
分类:编程语言   时间:2018-06-19 13:50:46    阅读次数:326
用R处理不平衡的数据
欢迎大家前往 "腾讯云+社区" ,获取更多腾讯海量技术实践干货哦~ 本文来自 "云+社区翻译社" ,作者 "ArrayZoneYour" 在分类问题当中,数据不平衡是指样本中某一类的样本数远大于其他的类别样本数。相比于多分类问题,样本不平衡的问题在二分类问题中的出现频率更高。举例来说,在银行或者金融 ...
分类:其他好文   时间:2018-06-18 12:40:05    阅读次数:296
358条   上一页 1 ... 14 15 16 17 18 ... 36 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!