一、精确率与召回率 1、精确率(Presicion) 预测结果为正例样本中真实为正例的比例(查的准)。 2、召回率(Recall) 真实为正例的样本中预测结果为正例的比例(查的全,对正样本的区分能力)。 3、精确率与召回率的理解 混淆矩阵 在分类任务下,预测结果(Predicted Conditio ...
分类:
其他好文 时间:
2020-06-19 00:35:03
阅读次数:
115
以下汇总了我用R写过的一些数据分析工程 不定时更新 [1] 主要涉及: 数据清洗,线性回归模型拟合,模型选择(R-squared, AIC等),树形方法(rpart(), xgboost()等) github中有详细介绍及全部代码:https://github.com/wojamesyegit/R- ...
分类:
其他好文 时间:
2020-05-30 21:33:25
阅读次数:
100
1.读取 2.数据预处理 # 词性还原def get_wordnet_pos(treebank_tag): if treebank_tag.startswith('J'): return nltk.corpus.wordnet.ADJ elif treebank_tag.startswith('V' ...
分类:
其他好文 时间:
2020-05-23 20:31:50
阅读次数:
70
模型估计与模型选择 模型估计 当损失函数给定时,基于损失函数的模型的训练误差和模型的测试误差就成为了学习方法评估的标准。测试误误差反映了学习方法对未知的测试数据集的预测能力,又被称为泛化能力。 过拟合:一味的追求提高训练数据的预测能力,所选模型的复杂度则往往会比真模型更高,但会造成过拟合。为了防止过 ...
分类:
其他好文 时间:
2020-05-23 09:56:42
阅读次数:
46
正则化与交叉验证用于模型选择 1 正则化 正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularizer)或罚项(penalty iterm )。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。比如,正则化项可以是模型参数向量的范数。 正则化一般形式: 正 ...
分类:
其他好文 时间:
2020-05-03 20:31:49
阅读次数:
81
XGBoost 相比于GBDT 做了两方面的优化: 一是算法本身的优化:在算法的弱学习器模型选择上,对比GBDT只支持决策树,XGBoost 还可以直接很多其他的弱学习器。 在算法的损失函数上,除了本身的损失,XGBoost 还加上了正则化部分,可以防止过拟合,泛化能力更强。 在计算方式上,GBDT... ...
分类:
编程语言 时间:
2020-05-03 17:02:08
阅读次数:
100
这是我在3dmax中创建的1cm*1cm*1cm的立方体,右图为3dmax中的坐标系 当我们把这个立方体导入到unity中发现x轴意外的扭转了90度 为了解决这个问题,你需要对模型做出修正 1、选定其中一个模型,在层次界面选择仅影响轴,先选定其轴。 2、在导出的时候在高级选项中将轴转化中的向上轴改为 ...
分类:
编程语言 时间:
2020-05-03 12:30:29
阅读次数:
259
"接口文档(一)" 三、经典模型选择 1、Lenet conv_2d relu maxpool2d conv_2d relu maxpool2d linear relu linear relu linear (仅作为说明模型结构,无意义,下同) 2、Alexnet features classfie ...
分类:
其他好文 时间:
2020-04-22 13:11:21
阅读次数:
75
论文地址:https://www.aclweb.org/anthology/P19-1281/ 作者:Henry Moss, Andrew Moore, David Leslie, Paul Rayson 机构:Lancaster University 研究的问题: 关注模型选择的问题,也就是在尽可 ...
分类:
其他好文 时间:
2020-04-21 22:28:52
阅读次数:
100
https://www.cnblogs.com/DjangoBlog/p/9575360.html 总结: sse、mse、rmse越接近于0,说明模型选择和拟合更好,数据预测也越成功 r-square“确定系数”的正常取值范围为[0 1],越接近1,表明方程的变量对y的解释能力越强,这个模型对数据 ...
分类:
其他好文 时间:
2020-04-19 17:46:58
阅读次数:
62