接上篇:
def xgboost_pred(train,labels,test):
params = {}
params["objective"] = "reg:linear"
params["eta"] = 0.005
params["min_child_weight"] = 6
params["subsample"] = 0.7
params["colsample...
分类:
编程语言 时间:
2015-08-06 00:42:08
阅读次数:
2984
import pandas as pd
import numpy as np
from sklearn import preprocessing
from keras.models import Sequential
from keras.layers.core import Dense, Activation, Dropout
# load training and test datasets...
分类:
编程语言 时间:
2015-08-04 21:12:47
阅读次数:
266
参考:http://scikit-learn.org/stable/modules/svm.html
在实际项目中,我们真的很少用到那些简单的模型,比如LR、kNN、NB等,虽然经典,但在工程中确实不实用。
今天我们关注在工程中用的相对较多的SVM。
SVM功能不少:Support vector machines (SVMs) are a se...
分类:
系统相关 时间:
2015-08-04 08:13:35
阅读次数:
358
三张表;train_set.csv;test_set.csv;feature.csv。三张表通过object_id关联。
import pandas as pd
import numpy as np
# load training and test datasets
train = pd.read_csv('../input/train_set.csv')
test = pd.re...
分类:
编程语言 时间:
2015-08-02 18:18:32
阅读次数:
229
在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上测试,下面介绍的是Python中训练模型的保存和再使用。scikit-learn已经有了模型持久化的操作,导入joblib即可from sklearn.externals import joblib模型保存>>> os.chdir("workspace/model_save")
>>> from sklea...
分类:
编程语言 时间:
2015-07-31 22:01:18
阅读次数:
336
参考:http://scikit-learn.org/stable/presentations.html
scikit-learn的User Guide基本看完了(除了具体estimator部分),这里再摘录scikit-learn官方网站提供的额外资源,供之后学习。
关于supervised learning和unsupervised learning中涉及到的estimator,用...
分类:
其他好文 时间:
2015-07-31 10:44:28
阅读次数:
123
参考:http://scikit-learn.org/stable/modules/learning_curve.html
estimator's generalization error can be decomposed in terms of
bias, variance and noise. The bias of
an estimator is its avera...
分类:
其他好文 时间:
2015-07-30 11:33:18
阅读次数:
157
参考:http://scikit-learn.org/stable/modules/model_persistence.html
训练了模型之后,我们希望可以保存下来,遇到新样本时直接使用已经训练好的保存了的模型,而不用重新再训练模型。本节介绍pickle在保存模型方面的应用。(After
training a scikit-learn model, it is desirable ...
分类:
其他好文 时间:
2015-07-30 09:33:44
阅读次数:
211
本文K折验证拟采用的是
Python 中 sklearn 包中的 StratifiedKFold 方法。
方法思想详见:http://scikit-learn.org/stable/modules/cross_validation.html
StratifiedKFold is
a variation of k-fold which returns stratified folds:...
分类:
编程语言 时间:
2015-07-29 21:24:34
阅读次数:
817
参考:http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter
三种方法评估模型的预测质量:
Estimator score method: Estimators都有 score method作为默认的评估标准,不属于本节内容,具体参考不同estimators的文档。Scorin...
分类:
其他好文 时间:
2015-07-29 10:25:49
阅读次数:
195