要在消费金融领域立足并长远发展,风控是关键。本文从消费者、商户和场景的角度探讨了风控需要把控的风险点,并介绍了评分卡的应用和“冠军挑战”。 本文指出,基于数据和技术驱动的方式管理风险,是行业未来发展的不可逆转的大方向,但风控也不能完全依赖于数据和模型。
中国早年的消费金融市场基本是银行消费信贷一家独大,消费形式主要以信用卡为主。近5年来,随着电商平台和互联网消费金融的迅猛发展,消费金融市场呈现百花齐放的格局。消费金融行业的早期发展也出现过授信过度、息费过高、个人信息保护不足等问题。在崛起的信贷市场中,要在消费金融领域立足并长远发展,风控是关键。
人、商户、场景的风险点:层层控制
从消费最本质的属性分析:消费分期,其实就是人用分期的方式来完成消费的目的。在完成这个目的的过程中一般会涉及三个元素:消费者、商户和场景。所以风控也可以把这个消费链条通过这三个元素拆开,分别探讨针对每一个元素应该怎么做。
一是消费者角度。消费者的风险一般可分为欺诈风险和信用风险,简单来说,就是这笔钱消费者“想不想还”(欺诈风险)和“能不能还”(信用风险)。衡量欺诈风险时一个核心环节是,判断一笔信用消费申请是否由信用申请人本人完成的。这时,常见做法是,让消费者提供一些身份证明相关信息,比如姓名、证件号、手机号以及银行卡,以及一些相关的第三方数据授权。
这授权背后还有很多门道。举例来说,如客户通过交互式授权的方式授予金融机构查询其在某三方机构的个人数据情况,通过客户填入在三方机构预留的经过认证手机号获取的动态验证码的方式,可以从一定程度上起到身份核实的作用。又如绑定银行卡的逻辑也是一样,如果消费者选择绑定银行卡进行信用消费申请,系统这时会给消费者当时在银行办卡时预留的手机号发送验证码,而不是消费者的消费场景下提供填写的手机号。相对越复杂的授权方式,如人脸识别等,核实的可信度越高,但同时对于客户体验的影响也会增加,潜在会增加客户的体验困难,导致客户流失。 所以选择一个可靠、体验好、流失低的授权核身方式是一个需要综合考虑的问题。
二是经营风险的角度。例如,用户通过分期完成了一笔交易,但是分期周期还未结束,这家商户就倒闭了——这种情况在教育、美容、健身场景下比较常见。试想,如果一个12期的课程,消费者只上了3期,这个店就歇业了,消费者有时会认为,之后课程的钱就不用还了。虽然法律上这种行为是违约的,机构可以对其进行催款,但是从实际情况和社会舆论的角度来看,大多数情况下是去做这样的催收是“不好”的事情。所以企业的经营风险也是做风控时需要前置考虑的点。
三是场景风险角度。场景风险就是判断这个消费环境是否是真实的。通过一个虚拟的、伪造出来的交易场景套取交易激励甚至授信额度,是需要防控的重点。 即使在传统信用消费的场景下,如果一张信用卡在国内不常被使用,而有一天突然在国外一家名贵珠宝店有一笔巨额消费,此时大多数情况下交易会受到限制,或者银行会通过电话等方式,核实这笔交易的真实性。
评分卡的应用贯穿消费前、中、后
行业内常用的是ABC三张评分卡。A卡、B卡、C卡分别表示获客评分卡(Acquisition)、行为评分卡(Behavior)和催收评分卡(Collection)。
以A卡举例,在前端的获客过程中,可能会用到信用风险模型、欺诈风险模型、渠道风险模型等。只要这些模型都用在获客的这个过程中,行业里就把这套东西统称为A卡。从模型的角度来看,它会对消费者未来的风险做预测,即模型会在消费者授权的情况下收集消费者多维度的信息,以此来预测,如果将一笔钱贷给了这位消费者,他接下来的一段时间内不还钱的概率有多大。比如这个数字超过了机构的风险偏好,这位消费者的信贷申请就会被拒。
行为评分是指消费者拿到信用额度后,模型根据消费者的行为数据,对其做出升额、降额的预判或预警。
催收评分会判断,例如当消费者出现逾期时,面对那么多逾期客户,机构应该先催谁。或者哪些消费者不用催,他就自动会把钱还回来。这些决定都是催收评分做出的。
数据、策略、模型的“冠军挑战”
ABC卡的每一项打分、每一个预测都是“数据驱动”的,这也意味着数据源本身非常重要。风控方可以对所采用的数据源(以及相应的策略和模型)用“冠军挑战”的方式筛选。
在接进数据时,风控方会和数据方做一些测试,但是这个测试通常是拿历史数据来测的。这就伴随一个问题:历史上在用户上测试有效果的数据,是否在今天判断新进来的客户上同样有效。因为任何情况下基于历史做出的假设,以及在历史里获得的经验,不一定完全适用于未来。为了控制未来和历史经验之间的差别所导致的决策风险,就需要设计一种“冠军挑战”机制。
“冠军挑战”是这样操作的:把目前表现理想的策略、数据和模型定义成“冠军组”,这个数据可能在历史上半年的时间,在几批用户上是有效果的。要判断这个“冠军组”是否适用于一批新的客户,就在这个数据源接进来之后,用测试组来测试其在当前这批客户上的表现。测试开始之后,业务在测试组里也在自然增长,一段时间之后,这策略的效果就能体现出来了,这时就可以根据这个策略的实际效果来判断其是否真的在新客户上有效。
在当前策略、模型、数据的产出实际表现之前,它都是“挑战组”。“挑战组”如果能达到预期,或是比现在的“冠军组”表现更优,就可以正式把这个“挑战组”的内容升级,与“冠军组”做对比。这样就永远会存在一些组不停地挑战现在的“冠军组”,它们要拿出更好的表现才能击败“冠军组”成为新冠军,而最后被智能信贷数据决策系统使用。
持续地保持冠军挑战的策略机制,可以形成内部竞争,提升策略效果,形成持续优化的有效机制。
风控的过去、现在和未来
当然,这些思考与实践是我们基于目前国内的数据可获得性,互联网生态环境,并结合金融风险的本质特征所探索出的道路。
基于数据和技术驱动的方式管理风险,是行业未来发展的一个不可逆转的大方向,金融机构要主动拥抱这个发展趋势。不过,同时也要认识到,目前国内的征信体系、大数据体系和数据环境还在逐步建设完善的过程中,各种数据的质量、可靠性也各不相同,参差不齐。这对于模型能力和技术能力带来很大的挑战。一方面,需要有收集、整理、汇总海量数据的能力,同时也要有识别、清洗“脏”数据,沙里淘金的能力。
直到现在,有观点认为,风控可以完全依赖于数据和模型,不需要人的经验——这显然是另一个极端。笔者认为,现在的环境还没有完全达到机器决策能完全替代人为判断的程度。对于一些问题,比如控制数据偏差或控制由于数据本身不佳而导致的模型风险,人为的调整和决策是很有必要的。
而从更长的时间维度来看,消费信贷这个行业已然存在几百年,几百年间银行家们积累锤炼出来的风险管理的理论和原则还是行之有效的。这种原则和理念对于发现和纠正数据偏差带来的模型风险和决策风险还是非常有用的。
观察风控发展的另一个角度,是模型技术和模型能力的演进。从传统的基于经验的专家模型,到量化的线性评分模型,到现在复杂结构的非线性模型,越来越复杂的模型能够越来越精细地刻画客户的风险特征,但同时模型本身复杂度增加导致模型的可解释性越来越有难度。如当下被热议的机器学习、深度学习的模型基本上是“黑盒子”。多层神经网络结构复杂以至于没有办法直观理解其效果的来源。虽然可能目前的结果可能是好的,但这样的模型和结构是否能够复制和随着时间变化延续,有很大的不确定性。对于模型策略的稳健性、可扩展性无法把握,甚至于监管要求的可解释性都无法很好的满足。这也是现在业界和监管机构都需要探索和解决的一个难题。
(童海为PINTEC读秒首席风控官。本文编辑/丁开艳)