传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -> 预测,分类。本文我们将依据传统机器学习的流程,看看在每一步流程中都有哪些常用的函数以及它们的用法是怎么样的。希望你看完这篇文章可以最为快速的开始你的学习任务。 1. 获取数据 1.1 导入s ...
分类:
其他好文 时间:
2020-02-06 19:45:45
阅读次数:
61
在上一节中,我们介绍了Pytorch的基本知识,如数据格式,梯度,损失等。 本节中,我们将介绍如何使用Pytorch来搭建一个实用的神经网络。 搭建一个神经网络并训练,大致有这么四个部分: 准备数据,搭建模型,评估函数,优化网络权重 1.数据准备 数据准备在上一篇中已讲过,这里就不多赘述了。 2.搭 ...
分类:
其他好文 时间:
2019-12-11 12:50:52
阅读次数:
113
作者:努力的孔子 https://www.cnblogs.com/yanshw/p/10735079.html 对模型进行评估时,可以选择很多种指标,但不同的指标可能得到不同的结果,如何选择合适的指标,需要取决于任务需求。 正确率与错误率 正确率 :正确分类的样本数/总样本数,accuracy 错误 ...
分类:
其他好文 时间:
2019-11-28 13:32:18
阅读次数:
61
Lift图衡量的是,与不利用模型相比,模型的预测能力“变好”了多少,lift(提升指数)越大,模型的运行效果越好。 TP:划一个阈值后的正样本。 P:总体的正样本。 在模型评估中,我们常用到增益/提升(Gain/Lift)图来评估模型效果,其中的Lift是“运用该模型”和“未运用该模型”所得结果的比 ...
分类:
其他好文 时间:
2019-11-24 19:39:48
阅读次数:
231
1.线性相关系数(皮尔逊相关系数)(用于描述两个变量之间相关性的强弱,系数越大相关性越强) rxy=∑(xi-x-)(yi-y-)÷√∑(xi-x-)2(yi-y-)2 一般判别效力为: 无相关←0.2←弱→0.4←中→0.6←强→0.8←极强→1 2.决定系数(用于描述非线性或两个以上自变量的相关 ...
分类:
其他好文 时间:
2019-11-23 09:31:33
阅读次数:
100
2.1预测流程 从确定预测主题开始,一次进行数据收集、选择方法、分析规律、建立模型、评估效果直到发布模型。 2.2.1确定主题 (1)指标:表达的是数量特征,预测的结果也通常是通过指标的取值来体现。 (2)主体:预测研究的对象。 (3)精度:预测能够达到的准确水平。 (4)周期:在预测工作开始前,需 ...
分类:
编程语言 时间:
2019-11-21 13:51:04
阅读次数:
96
在搭建网络模型时通常要建立一个评估模型正确率的节点(evaluation_step) 这里介绍一个对于分类问题可以用的评估方法: 代码: correct_prediction = tf.equal(tf.argmax(logits, 1), tf.argmax(groundtruth_input, ...
分类:
其他好文 时间:
2019-11-17 11:09:02
阅读次数:
141
模型评估与选择 经验误差与过拟合 (1)错误率:分类错误的样本数占样本总数的比例 精度:1$ $错误率 (2)误差:学习器的实际输出与样本真实值之间的差异 误差有训练误差和泛化误差两种。训练误差指的是学习器在训练集上的误差,也称为经验误差;泛化误差指的是在新样本上的误差。 (但是,对于训练样本,其分 ...
分类:
其他好文 时间:
2019-11-17 00:59:46
阅读次数:
100
这一篇我们将开始使用scikit learn的API来实现模型并进行训练,这个包大大方便了我们的学习过程,其中包含了对常用算法的实现,并进行高度优化,以及含有数据预处理、调参和模型评估的很多方法。 我们来看一个之前看过的实例,不过这次我们使用sklearn来训练一个感知器模型,数据集还是Iris,使 ...
分类:
编程语言 时间:
2019-11-14 20:01:52
阅读次数:
134
某分模型评估 1.iv值大于2直接作为规则。其中看一下覆盖率、坏客户率。坏客户率达到60%以上就作为直拒规则。看一下每个区间中,累计的样本占比,累计的坏账率。如果满足低命中率(样本占比),高准确率(一般坏样本率60%)就把它作为规则放到风控中。 2.等频分箱,计算woe值,iv值,iv值大于2小于0 ...
分类:
其他好文 时间:
2019-11-09 17:46:51
阅读次数:
100