码迷,mamicode.com
首页 > 其他好文 > 详细

征信用户数据分析

时间:2016-12-28 15:16:37      阅读:188      评论:0      收藏:0      [点我收藏+]

标签:images   挖掘   分享   比例   基于   数据   添加   分类   之间   

最近在参加征信的数据挖掘与分析,征信通俗点说就是用户的信用度评分。

初步分析已有的数据时,将用户的信用评分分为以下5个维度。

维度:维度的划分是基于已有的数据源所能获得的信息来指定的,当然还有其他的某些数据信息暂时没有添加进来。

维度评分:在初版时,自己估计打分,并没有细究这些分值比例。

维度权重: (当前行维度评分/总评分)* 100

 技术分享

 

这样就得到我们大概的方向分类,然后我们在细分每个大维度下的小指标,如下表:

技术分享

最后根据每项指标的不通区间分别指定分值如下表:

这个总的分值区间是300-900,考虑今后可能有减分项,所以保留最低分是300分。

技术分享

这样一个粗略的用户信用模型基本构建完成,剩余的就是数据的关联和统计了。

综合的思维导图如下,我们一阶段只取了其中的部分指标:

技术分享

 

最终我们计算出的分值区间如下图,可以看出在分值340-500之间占了大部分比例。其中分值在340-400之间的用户最多。

技术分享

 

征信用户数据分析

标签:images   挖掘   分享   比例   基于   数据   添加   分类   之间   

原文地址:http://www.cnblogs.com/30go/p/6229236.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!