标签:分数 森林 划分数 blank 离散化 core 异常 逻辑 缺失值
https://blog.csdn.net/zpxcod007/article/details/80118580
制作A卡,申请评分卡
数据集:15万个样本,特征
主要预处理手段:缺失值,异常值,样本不平衡的处理,划分数据集,做分箱处理(离散化),将样本的每个特征都映射到WOE空间
之后建模,这里采用:逻辑回归,决策树和随机森林建模,在auc-roc指标上,随机森林表现最优秀,这里选取了随机森林做后续的制作评分卡(利用得到变量系数并自行拟定了评分标准建立了评分卡。)。
建立评分卡:
以上论文资料得到:
a=log(p_good/P_bad)
Score = offset + factor * log(odds)
在建立标准评分卡之前,我们需要选取几个评分卡参数:基础分值、 PDO(比率翻倍的分值)和好坏比。 这里, 我们取600分为基础分值,PDO为20 (每高20分好坏比翻一倍),好坏比取20。
标签:分数 森林 划分数 blank 离散化 core 异常 逻辑 缺失值
原文地址:https://www.cnblogs.com/ivyharding/p/11505071.html