随着互联网金融的发展,对数据分析的需求越来越大。数据分析的目的其实是为了找到风险和收益的平衡点。高收益伴随着高风险,而低风险的回报又如同鸡肋。所以,太高的风险,太低的收益都不行。平衡点通俗来讲就是风险在控制范围之中,收益也可以接受。为了找到平衡点,我们通常会计算许多风控指标,这些风控指标是什么意思,他们有什么作用,我们挑几个金融领域比较常用的指标说说。
1、vintage
vintage这个词源于葡萄酒业,意思是葡萄酒的酿造年份。我们在生活中经常会进行各种各样的比较,但是比较有个前提,就是比较的事物应该是位于同一层面上的。如果你拿四年级的学生和1年级的学生比较身高,或者拿成年人和未成年人比较体重那是毫无意义的。同理,我们在比较放贷质量的时候,也要按账龄(month of book,MOB )的长短同步对比,从而了解同一产品不同时期放款的资产质量情况。
举例来说,今天是2018年5月25日,我们取今天贷款第一期到期的客户作为观察群体,观察他们今后29天的还款情况。如果你将将今天所有贷款到期的客户作为观察群体(里面有第一期到期的,也有第二期到期的,也有第三期到期的,等等),那么这个群体里面的客户就不是位于同一层面上了。
到了下个月,6月25号,我们取6月25号贷款第一期到期的客户作为观察群体,观察他们之后29天的还款情况。这样你就可以比较5月25号的群体和6月25号的群体的还款情况差异。如果6月25号的群体还款质量有显著性降低(如下图),那么你可能会审视一下你这一个月来的营销策略是否变宽松了,或者这一个月来国家政策有什么改动等等。
当期未还本金/当期应还金额 | DAY0 | DAY1 | .... | DAY29 |
2018-05-25 | 60% | 55% | ... | 15% |
2018-06-25 | 80% | 75% | ... | 25% |
表格数字属于虚构。
以上就是vintage的介绍。传统的销售统计报表大多数情况下只是将不同渠道、不同时间、不同产品的数据进行统计,是顺序的,平面的。vintage将不同时期的数据拉平到同一时期比较,可以很直观地比较和反思不同时期公司的营销策略的效果。
2、迁移率
在说迁移率之前,我们先定义逾期阶段的概念。逾期就是说你到了该还款的日子而没有还款,那你就进入了逾期。根据逾期天数,又分为M0-M7+等八个阶段。没有逾期的是M0,逾期1~29天的是为M1,逾期30~59的定义为M2,以此类推,逾期超过180天的定义为M7+。
有了逾期阶段的概念,迁移率就好理解了。简单说,就是处于某一逾期阶段的客户转到其他逾期阶段的变化情况。迁移率通常可以用来预测不同逾期阶段的未来坏账损失。比如,M2-M3,说的是从逾期阶段M2转到逾期阶段M3的比例。需要注意的是,我们应该选还款日为同一天的M2来做分子,如下。
指标 | 2018-05-25 | 2018-05-26 | 2018-05-27 | 字段说明 |
M2-M3 | xx% | xx% | xx% | 前一天处于M2并且还款日为当天的、在当天处于M3的客户数 / 前一天处于M2并且还款日为当天的客户数 |
迁移率是催收常使用的绩效指标。它与vintage结合能实现风险的精细化管理。vintage的核心思想是对不同时期的同一层面的资产进行分别跟踪,按照账龄长短进行同步对比,从而了解不同时期的资产质量情况,是一个所谓竖切的概念;而迁移率能很好的提示客户整个生命周期中的衍变情况,是一个所谓横切的概念。
3、滚动率
在风险控制中,我们的根本目的是识别坏用户,通过历史数据,抓取坏客户显著区别于正常客户的特征,并以此为标准去预测未来的坏客户。用户的好坏其实很难定义,不能说逾过期的用户就是坏用户,也许人家其实想还,只是不小心忘记还款了呢。而且,有的时候,“适当”的逾期还能增加公司的逾期利息收入。我们所关注的坏客户是坏到某一程度,也就是逾期等级较高且不还款的客户。
前面说的vintage是从时间维度上判断客户群体的好坏,下面说的滚动率则是从行为程度上判断客户的好坏,它可以帮助我们判断某些逾期客户是否还可以再抢救一下,收回点成本。
滚动率,简单地说就是以某一时间点为观察节点,观察客户在该点前一段时间内(比如半年)最坏逾期阶段,并追踪其在观察点之后的一段时间向其他逾期阶段发展的情况,特别是向更坏程度发展的情况。举个栗子,今天是2018年5月25日,取今天的1万个客户,统计他们在过去半年里的最大逾期阶段。然后追踪他们后半年的表现。以下数字纯属虚构,完全是为了说明问题,各个公司有自己的观察数据和追踪数据。
M0的客户在未来半年里,98%的客户还是会保持正常M0的状态
最大逾期阶段M1的客户在未来80%会变M0,但是还有20%会继续,甚至有5%的人往更坏的程度发展
最大逾期阶段M2的客户在未来40%的人会继续恶化,22%左右的人会变M0(完全从良);
最大逾期阶段M3的客户在未来60%的人会继续恶化,15%左右的人会变M0(完全从良);
最大逾期阶段M3+的客户在未来80%的客户会继续此状态(没救了)。
根据以上的数据,我们可能就可以得出逾期3期以上的客户,都是无力抢救的坏客户这样的结论。假如我们想把条件收紧一点,那么我们可能会选择逾3期或者2期。再假如我要给坏设定等级,那么我就可以把3期以上设为极度坏,逾3、2期的话可能设置为中度坏,逾1期的人可以是不经意的坏。这些特征将来可以放到风控建模的样本特征中来。
4、入催率
有了前面的铺垫,入催率就比较简单了。它指的是在某一个还款日,客户从M0变成M1的比例。比如说,今天,有N个M0客户到了还款日,里面有M个客户按时还款了,那么今天的入催率就是(N-M)/N。它与下面的FBD是有区别的。
5、FPD
FPD是指首期逾期率,是说在某一个还款日,仅第一期到期的客户中有多少没有按时还款。与入催率的差别在于,入催率包含了第一期、第二期、第三期等等所有到期的M0。FPD一般用来做反欺诈,因为欺诈用户他第一期是根本不会还款的。
好了,这次先写这么多,以后学到新的东西再做记录。