一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgboost4j-flink等。xgboost的基础也是gbm,即梯度提升模型,它在此基础上做了进一步优化 ...
分类:
编程语言 时间:
2021-07-05 19:03:36
阅读次数:
0
multiclass与multilabel的区别 multiclass分类是指n取1 multilabel分类是指n取k 对于xgboost,如果想要做multiclass分类可以借助sklearn的 from sklearn.multiclass import OneVsRestClassifie ...
分类:
其他好文 时间:
2021-01-11 10:48:14
阅读次数:
0
XGBoos博客 \[ x+y=z \] XGBoost是一种以决策树(cart树)为基学习器的集成学习方法。 XGBoost的目标: \(Loss=\large{\sum\nolimits_{i=1}^{n}{l(y_i,\hat{y_i}) + \sum\nolimits_{k=1}^{T}{\ ...
分类:
其他好文 时间:
2020-10-18 10:15:10
阅读次数:
33
本文主要总结集成学习(ensemble learning)中一大类boosting模型--梯度提升。主要包括GBDT, XGBoost, LightBoost, CatBoost 这4种模型的原理,以及关于这4个模型的简单示例。 ...
分类:
其他好文 时间:
2020-09-08 20:50:31
阅读次数:
37
0、万恶之源版本号 tensorflow,pytorch,显卡版本,conda版本 1、什么是GBDT? 2、xgboost在GBDT上做了哪些优化? 3、随机森林核心思想有几个,分别是什么? 1、gradient boosting decision tree 一种基于boosting增强策略的加法 ...
分类:
其他好文 时间:
2020-07-29 10:18:11
阅读次数:
78
做机器学习的时候经常用到XGB,简单记录一下 K折交叉验证也是模型常用的优化方法。一起记录。。。 K折交叉验证:类似三个臭皮匠,顶个诸葛亮。我的理解是,就是用民主投票的方式,选取票数最高的那个当结果。K折就是分成K份数据来进行。K= 5就是5折交叉验证,K= 7就是7折交叉验证,K=10就是10折。 ...
分类:
其他好文 时间:
2020-07-18 22:48:42
阅读次数:
81
1.数据预处理 xgb 训练的数据是 DataFream 不能是List 读取数据 利用pandas 读取数据,这里读取的是excel数据 data = pd.read_excel(filename, sheet_name='tabelname') 分词处理 利用jieba分词搞定 seg1 = j ...
分类:
其他好文 时间:
2020-07-08 23:05:15
阅读次数:
64
一篇文章搞定GBDT、Xgboost和LightGBM的面试 丢丢 一枚永远找不到路的 路痴 GBDT和XGB基本上是机器学习面试里面的必考题。最近面试了五十场面试,基本三分之二的面试官都问了关于GBDT和XGB的问题。 下面把里面常用的知识点、常见的面试题整理出来 首先来说集成学习 集成学习 bo ...
分类:
其他好文 时间:
2020-07-03 21:40:21
阅读次数:
47
问题根源:初学者或者说不太了解Python才会犯这种错误,其实只需要注意一点!不要使用任何模块名作为文件名,任何类型的文件都不可以!我的错误根源是在文件夹中使用xgboost.*的文件名,当import xgboost时会首先在当前文件中查找,才会出现这样的问题。 所以,再次强调:不要用任何的模块名 ...
分类:
其他好文 时间:
2020-06-24 23:21:56
阅读次数:
149
以下汇总了我用R写过的一些数据分析工程 不定时更新 [1] 主要涉及: 数据清洗,线性回归模型拟合,模型选择(R-squared, AIC等),树形方法(rpart(), xgboost()等) github中有详细介绍及全部代码:https://github.com/wojamesyegit/R- ...
分类:
其他好文 时间:
2020-05-30 21:33:25
阅读次数:
100