码迷,mamicode.com
首页 > 其他好文 > 详细

某分行联合贷产品建模结果(未完成)

时间:2019-11-09 17:46:51      阅读:100      评论:0      收藏:0      [点我收藏+]

标签:差距   缺失值   分行   风控   graphs   校验   策略   消费   建模   

某分模型评估

1.iv值大于2直接作为规则。其中看一下覆盖率、坏客户率。坏客户率达到60%以上就作为直拒规则。看一下每个区间中,累计的样本占比,累计的坏账率。如果满足低命中率(样本占比),高准确率(一般坏样本率60%)就把它作为规则放到风控中。

2.等频分箱,计算woe值,iv值,iv值大于2小于0.01的删掉。(分箱有很多种)。woe的排序和值,woe的单调性。

3.缺失值大于80%的变量删掉。

先过模型,后又过的规则(iv值规则)。

4.逻辑回归p值要显著,否则删掉,相关性,vif值。

0.44

0.79

最终评分20等分分组,合并之后分了。

最终lr模型6个变量。

5.对业务风险判断的指标:审核通过率,坏客户召回率,通过用户的坏账率。

6.贷中监控。前三个月稳定性按周来看,后面可以按月来做。ks监控。对变量的psi和ks监控。当突破阈值后就要更新。监控逾期情况。试运行结束后要上一个报告。

7.授信额度通过率、信用风险通过率。

 

 

 

问题:

1.模型在测试集和训练集的分数分布是否一致?中心一致吗?形状差距有多大?如何考虑的?为什么?

2.为什么取逾期30天为y?有什么理论依据?

3.信息校验和黑名单拒绝的命中率有多少?后面建模时把这些样本也放进去了吗?

4.这次建模数据是阿波罗数据?然后又在阿波罗数据上进行的汇总分箱?

5.采样这块,数据不均衡怎么处理的?

6.没有跨时间验证。

7.没有用户申请时间。为什么没有?这个信息很敏感吗?

8.申请时间、放款时间、逾期时间。

9.变量分箱这块,全都用等频分箱?这样划分的每个区间还有业务意义吗?为什么没有考虑和y的关系分箱?比如卡方分箱?

10.消费等级评分的计算逻辑?是否是稳定的?

 

 

大数据部:

数据、变量处理。

一开始22个变量,之后iv删掉11个,又把lr变量显著性不显著的5个变量删掉,最后有6个变量进入最终模型。

 

反欺诈策略分析:

欺诈率,坏客户率。

 

 

信息科技部:模型开发团队、模型部署团队。

系统改造(包括和总行系统对接,模型参数修改等)。

 

1.对接外部数据。

2.模型部署,信息科技部给个人部开账号。

某分行联合贷产品建模结果(未完成)

标签:差距   缺失值   分行   风控   graphs   校验   策略   消费   建模   

原文地址:https://www.cnblogs.com/ironan-liu/p/11826791.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!