标签:假设 导致 :hover 相同 图表 历史 图算法 ati ssi
风控是互联网金融公司开展业务的底层基石,是一块值得精细耕耘的领域。模型方面从早期偏特征工程的风险画像、风险聚类、特征推荐,发展到时序预测(ARIMA、GARCH、Holt-Winter)、 异常检测(IF)、图算法、自动机器学习等建模挖掘工作。本篇将以该领域新人的角度出发,整理金融风控领域的相关基础知识。
评分卡模型基于假设“历史样本和未来样本服从同一总体分布”,故而才能从历史样本中归纳出数理统计规律来预测未来样本的表现。 评分卡通常采用逻辑回归(Logistics Regression)进行建模,其原因有很多,比如可解释性、简单模型、小样本学习等等。
为了简化处理,我们只考虑一个自变量 x ,那么评分卡模型的形式为:
其中令Odds(几率)= p(1-p),P为模型预测为1的概率,则Odds越大,代表预测为1的概率越高。
评分卡模型对特征筛选
有以下偏好:
WOE(Weight of Evidence)叫做证据权重,用于将两变量间的非线性关系转换为线性关系。
实际计算时,先将数据分箱,计算每个分箱的WOE,使其值呈单调趋势(若不单调则继续分箱,相邻分箱WOE值相同时合并)。
当一个分箱内只有Good(正常用户)或Bad(逾期用户)时,可对WOE公式进行修正如下:
IV值用于评估变量的预测能力,可认为是WOE的加权和,常用来快速筛选变量。
在应用实践中,其评价标准如下:
在信贷风控中,指标时反应业务变化最直观的手段,通过对指标的分析及时发现和定位业务开展过程中的问题,并及时采取相应的手段进行防控。
(First/Second/Third Payment Deliquency)
一般情况下每个月的FPD1% >
SPD1% >
TP1%,FPD30% >
SPD30% >
TPD30%,以图表形式展示后如果曲线出现交叉情况,则表明某包资产出现异常,需要单独对这个异常指标进行拆分。拆分的维度一般有省份、渠道等。
Vintage是以账龄MOB(month on book)为轴,观察每个放款月贷后的质量情况,分母为对应月份的放款本金,分子是截止期末时点逾期Mn+客户的所有剩余未还本金,可观测一个多期产品的风险全貌。 可以分为M1/M2/M3、M1+/M2+/M3+的件数/金额Vintage。
Vintage曲线的前几期会呈上升趋势,由于逾期会在前几期充分暴露出来。到后期逾期逐渐稳定,Vintage曲线的走势会逐渐平缓。
如果Vintage曲线在某一期都出现了翘尾,因此应该关注这个时期是不是出现了结构性异常,比如说节假日影响了客户还款以及催收作业等。
迁徙率可以用来预测不同逾期阶段的未来坏账损失,是资产管理中的核心指标,可以分为M0-M1、M1-M2、M2-M3、M3-M4迁徙率,同时也可以拆分为件数、金额的迁徙率。计算公式大致如下,以月末金额迁徙率为例:
如果迁徙率出现大于1的情况,往往会有两种原因,以M0-M1迁徙率为例:
回收率和迁徙率是高度相关的两个指标,比如本月M1的回收率较高,那么相应的M1-M2的迁徙率就会变低。仔细分析一下这两个指标的计算逻辑(按未还本金的口径计算):
由于分母不一样,所以M1的回收率不可以用1减去M1-M2迁徙率,但是迁徙率和回收率成反比关系是确定的。回收率高,迁徙率自然就会低。回收率的计算一般有三种口径:
未完待续…
标签:假设 导致 :hover 相同 图表 历史 图算法 ati ssi
原文地址:https://www.cnblogs.com/cx2016/p/13824969.html