码迷,mamicode.com
首页 >  
搜索关键字:scikit    ( 627个结果
machine learning in coding(python):使用xgboost构建预测模型
接上篇: def xgboost_pred(train,labels,test): params = {} params["objective"] = "reg:linear" params["eta"] = 0.005 params["min_child_weight"] = 6 params["subsample"] = 0.7 params["colsample...
分类:编程语言   时间:2015-08-06 00:42:08    阅读次数:2984
machine learning in coding(python):根据关键字合并feature,删除无用feature,转化为numpy数组
import pandas as pd import numpy as np from sklearn import preprocessing from keras.models import Sequential from keras.layers.core import Dense, Activation, Dropout # load training and test datasets...
分类:编程语言   时间:2015-08-04 21:12:47    阅读次数:266
scikit-learn(工程中用的相对较多的模型介绍):1.4. Support Vector Machines
参考:http://scikit-learn.org/stable/modules/svm.html 在实际项目中,我们真的很少用到那些简单的模型,比如LR、kNN、NB等,虽然经典,但在工程中确实不实用。 今天我们关注在工程中用的相对较多的SVM。 SVM功能不少:Support vector machines (SVMs) are a se...
分类:系统相关   时间:2015-08-04 08:13:35    阅读次数:358
machine learning in python:根据关键字合并多个表(构建组合feature)
三张表;train_set.csv;test_set.csv;feature.csv。三张表通过object_id关联。 import pandas as pd import numpy as np # load training and test datasets train = pd.read_csv('../input/train_set.csv') test = pd.re...
分类:编程语言   时间:2015-08-02 18:18:32    阅读次数:229
机器学习-Python中训练模型的保存和再使用
在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上测试,下面介绍的是Python中训练模型的保存和再使用。scikit-learn已经有了模型持久化的操作,导入joblib即可from sklearn.externals import joblib模型保存>>> os.chdir("workspace/model_save") >>> from sklea...
分类:编程语言   时间:2015-07-31 22:01:18    阅读次数:336
scikit-learn:External Resources, Videos and Talks
参考:http://scikit-learn.org/stable/presentations.html scikit-learn的User Guide基本看完了(除了具体estimator部分),这里再摘录scikit-learn官方网站提供的额外资源,供之后学习。 关于supervised learning和unsupervised learning中涉及到的estimator,用...
分类:其他好文   时间:2015-07-31 10:44:28    阅读次数:123
scikit-learn:3.5. Validation curves: plotting scores to evaluate models
参考:http://scikit-learn.org/stable/modules/learning_curve.html estimator's generalization error can be decomposed in terms of bias, variance and noise. The bias of an estimator is its avera...
分类:其他好文   时间:2015-07-30 11:33:18    阅读次数:157
scikit-learn:3.4. Model persistence
参考:http://scikit-learn.org/stable/modules/model_persistence.html 训练了模型之后,我们希望可以保存下来,遇到新样本时直接使用已经训练好的保存了的模型,而不用重新再训练模型。本节介绍pickle在保存模型方面的应用。(After training a scikit-learn model, it is desirable ...
分类:其他好文   时间:2015-07-30 09:33:44    阅读次数:211
Python 之 sklearn 交叉验证 数据拆分
本文K折验证拟采用的是 Python 中 sklearn 包中的 StratifiedKFold 方法。 方法思想详见:http://scikit-learn.org/stable/modules/cross_validation.html StratifiedKFold is a variation of k-fold which returns stratified folds:...
分类:编程语言   时间:2015-07-29 21:24:34    阅读次数:817
scikit-learn:3.3. Model evaluation: quantifying the quality of predictions
参考:http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter 三种方法评估模型的预测质量: Estimator score method: Estimators都有 score method作为默认的评估标准,不属于本节内容,具体参考不同estimators的文档。Scorin...
分类:其他好文   时间:2015-07-29 10:25:49    阅读次数:195
627条   上一页 1 ... 53 54 55 56 57 ... 63 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!