码迷,mamicode.com
首页 > 其他好文 > 详细

训练贷款模型时样本、模型、监控的一些点

时间:2019-08-24 21:19:02      阅读:319      评论:0      收藏:0      [点我收藏+]

标签:业务   好的   链接   tar   完成   样本   变量   ref   false   

 

一.样本

理想情况下,样本分三部分。

训练样本70%

验证样本(有时也叫测试样本)30%

跨时间验证样本:但经常这块数据没有,那也就只用前面的数据来做也可以。

二.如何确保模型训练完成

1.训练样本的roc和ks达到比较好的水平(0.7,0.3及以上)

2.验证样本和训练样本的指标差距不大(如10%,也要根据ks和roc的绝对值来看)

3.跨时间验证样本和训练样本的指标差距不大(如10%,也要根据ks和roc的绝对值来看)

三.模型上线监控

变量稳定性

模型稳定性

模型ks

通过率、拒绝率、在各种被拒原因的统计

四.其它的一些名词

主要涉及到oot(跨时间验证)、时间窗口、观察期、表现期、vintage分析、Roll Rate分析(滚动率分析)、迁移率等概念。

vintage分析:不同时间的客户,某些逾期指标的比较,可以看出不同时间段的客户、政策、数据等的质量好坏。

滚动率分析:某一部分用户,他们逾期的转化的情况,从m0--m1,从m1--m2,从m2--m3等,分析用户还款特点。

有一个比较好的链接   Vintage、滚动率、迁移率的应用 在业务中要积极使用这些科学指标进行贷款业务的监测。

 

 

训练贷款模型时样本、模型、监控的一些点

标签:业务   好的   链接   tar   完成   样本   变量   ref   false   

原文地址:https://www.cnblogs.com/ironan-liu/p/11405645.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!