码迷,mamicode.com
首页 > 编程语言 > 详细

python使用记录

时间:2019-06-07 22:33:44      阅读:91      评论:0      收藏:0      [点我收藏+]

标签:pat   justify   依据   nsf   roc   处理   lang   ons   from   

指定启动Jupyter notebook的版本

python3.6 -m jupyter notebook时,查看在jupyter notebook内部打印sys,path,发现调用的并不是python3.6,而是python2.7,只能先把python2.7里面的jupyter notebook uninstall

当评估估计器的超参数时,为什么要设置一个验证集?

在调参时,我们一般调整参数直至估计器达到最优,但是这有可能将测试集中的信息“泄露”给估计器,而且评估指标也不再报告泛化性能。设置验证集可解决这一问题,即在训练集上进行训练,验证集上评估,当实验似乎成功时,在测试集上进行最终评估。

交叉验证优缺点

通常,我们将数据分成3组,这大大减小了可用于学习模型的样本数,浪费数据。使用交叉验证可以解决这一问题,但是计算代价更大。

pipeline

pipeline的输入为一连串的数据挖掘步骤,其中最后一步必须是估计器(Estimator),可理解成分类器前几步是转换器(Transformer)。输入的数据集经过转换器的处理后,输出的结果作为下一步的输入,使得编写估计器更容易,在交叉验证下提供此行为:

>>> from sklearn.pipeline import make_pipeline

>>> clf = make_pipeline(preprocessing.StandardScaler(),PCA(n_components=2),svm.SVC(C=1))

>>> cross_val_score(clf, iris.data, iris.target, cv=cv)

去重后,依据原来列表的顺序进行排序

a = [1,1,4,5,2,2,9,9]
m = list(set(a))

m.sort(key=a.index)

python使用记录

标签:pat   justify   依据   nsf   roc   处理   lang   ons   from   

原文地址:https://www.cnblogs.com/amy5526/p/10989233.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!