订阅 登录 注册

ZRobot CEO 乔杨:海量数据资源结合先进模型算法,驱动信贷风险技术进步

  近日,2019爱分析·中国科技创新大会在京进行,金融科技分论坛上,《清华金融评论》金融家理事会会员ZRobot CEO乔杨受邀进行主题演讲,本文根据其演讲···

123

 

近日,2019爱分析·中国科技创新大会在京进行,金融科技分论坛上,《清华金融评论》金融家理事会会员ZRobot CEO乔杨受邀进行主题演讲,本文根据其演讲内容整理。

大家下午好,非常感谢主办方给我这个机会,我今天分享的主题是“数字科技驱动的信贷风险技术”。

首先请允许我简单介绍一下我们公司。

ZRobot成立于2016年11月,作为京东数科旗下的大数据公司,致力于利用京东海量高维数据资源,同时结合业内最先进的数据挖掘技术和模型算法,不断提升打磨自身技术实力,同时赋能我们的合作伙伴,帮助他们提升自己的风控实力以及运营效率。目前已经为银行、保险、证券、持牌消金、小贷公司等超过两百家金融机构提供了各类数据产品支持和智能风控解决方案。

一、数据资源独特 合作维度广泛

作为股东及主要数据源之一,京东数科的数据具备大、厚、动的特点,也就是数据量大,数据维度高,同时具备实时更新的能力。

基于自身多年在电商零售及不同金融场景下的积累,京东数科每天新增的数据量级达到800TB,比一些小型科技公司1年的数据增量还要多。

同时,京东数科已与700多家金融机构合作,共同服务线上线下商户达800万个,个人用户数量超过4亿。可入参模型变量超过60万维,已搭建并成功应用的风险策略超过5000个,风险模型超过500个。活跃客户65%以上为80后主力消费人群,也是消费及金融领域的核心客户人群。

除了京东数科及京东体系的数据之外,ZRobot也与中国银联、三大运营商等头部数据合作方展开深度合作,加上与腾讯、百度等联手成立的京腾计划、京度计划等,目前可对超过6亿的个人进行准确的风险评估。有了强大的数据基础,ZRobot可以将数据技术发挥到极致,目前在AI领域实现了一系列突破包括全流程智能风险识别,生物识别,AI模型能力等。

二、数据源开放趋势明显 定制化风控服务全面赋能

今天的主题会从四个大的维度去讲,每一个维度我会举一个简单的例子。我们认为整个数字科技驱动的风控发展趋势是从四个维度去看的。

第一个,从数据源的角度讲,我们认为将来的数据源会变得越来越开放,数据孤岛会被进一步打通,逐步形成数据共享机制。

第二个,是从整个模型的搭建方式上面,我们会看到从监督式学习向无监督学习的迭代和发展。

第三个,对于风险的单点判断,会向群像特征转变。

最后一个,就是中心化管理更多会向去中心化的应用靠拢。

首先从数据源的角度讲,通过我们的数据挖掘技术,目前已经形成了刻画完整用户画像的数据维度及属性。包括个人基本信息、生物特征、家庭信息、职业信息、资产信息、教育信息、消费记录等等。

有了这个属性基础,无论在风险管理方面,还是在精准营销方面,都能对用户做出比较全面和准确的判断。

数据孤岛的打通,通过什么样的方式可以有效做到呢?

第一个有效的方式,我们认为可以通过联合建模的方式做到。大家都比较熟悉的业内联合建模一般遵循五大步骤进行。从提交样本到最终部署上线及模型校验。我们认为,在整个联合建模的过程中,尽管能够把数据资源打通,但是模型效果高度依赖于建模团队本身的实力。每家公司的建模团队实力是参差不齐的,因此我们在建模流程中赋予了合作方的建模团队一系列额外工具以及定制化的增值服务。

比如说我们数据清洗和特征工程阶段。做模型的人都知道,特征工程是建模最核心的过程,我们不仅把积累的数据字段推送到建模环境中供合作方使用,也会通过我们的核心模型加工训练方法提炼出我们认为对业务方行之有效的特征变量并输送到建模环境中,帮助我们的合作方更好地搭建自己的模型。

同时,我们的模型可以基于我们的合作方的业务需求做定制化的建模,不限于风险类的模型,可以是精准营销类的模型,也可以是需求预测类的模型等等。

在整个第二步模型搭建过程中,可能有一些团队,尤其是银行方的建模团队,对于像机器学习这样的算法并不是很熟悉或者缺乏一定的业务相关经验,如果需要这方面的模型咨询以及额外的团队参与和辅导,我们在这个环节也会提供一系列定制化服务,直至最终模型上线。

三、数据技术抵御团体欺诈风险 更好服务白名单客户需求

第二个趋势我刚才也提到了,就是向群像特征的演变,刚才维信金科的李总也提到了,现在的欺诈风险,在中国信贷环境下远高于信用风险。

随着欺诈手段的不断升级,欺诈的团伙化特征也日益明显,欺诈的上下游产业链也越来越庞大,越来越成熟。仅仅通过对个人的欺诈风险判断不能防范团伙作案带来的影响和损失。我们提出的漫网技术有效的解决了这个问题:类似谷歌提出的Graph Learning, 对用户全方位的关联关系进行识别包括设备关联,地址关联、通信关联等等,构建用户的关系网络图谱,通过无监督算法将无差别用户划分为不同群组,同时针对关联关系强弱进行判断设定权重。漫网的优点非常明显,也有非常成功的应用案例。

这个构建过程的优点是非常多的,不需要做数据打标,也不需要专家经验,同时还可以做提前预警,我们在内部做了非常多的应用。

在商城注册上,我们的覆盖度达到98%,而且准确度达到99%。在金融刷券类场景,我们的覆盖率达到92%,准确率达到96%。有了内部的打磨和迭代,可以将成熟的技术对外进行赋能。

刚才我提到,非监督学习这方面的应用会越来越广泛,我们提出另外一个概念叫“斑马扩散”,其实它的含义非常好理解,中国有一句古话叫近朱者赤,近墨者黑。

我认为,我们不能只关注“黑”而去忽略“白”,这个关联关系不光是应用在黑名单扩散和反欺诈领域,还可以应用在白名单授信上,基于我们积累的黑名单历史记录以及白名单用户的表现,进行复杂网络的搭建,结合我们的专家规则,可以把我们的白名单扩散以及额外授信做大,这种技术的应用可以在降低授信成本的基础上大幅提升信贷效率,开辟了金融信贷领域的新天地。

刚才我也提到了,特征挖掘是我们非常核心的技术壁垒。我举一个具体的例子,大家知道用户的显性偏好,往往通过一些表层特征的挖掘,基于一些线性模型即可得到结论,但往往会出现较大偏差。如果不能对特征进行修正的话,结论会产生极大的误导性。

如果把这些结论作为业务方面的判断,甚至会造成灾难性的结果。

怎么对特征进行修正?很简单的做法,我们自下而上地看下这个修正流程。第一步我们可以对比如浏览、关注、购物车、交易等表层特征进行提炼,通过牛顿冷却定律对特征进行修正。

牛顿冷却定律指的是物体当前温度为前一时间单位下的温度与时间衰减因子的乘积。这样做的必要性在于,比如从时间维度考虑,最近一个月的消费比六个月前甚至更久远的消费对于判断用户偏好的贡献更大。引入牛顿冷却定律,赋予不同时间节点消费特征不同的衰减因子,可以将特征的描述准确度提升。

第二步可以用Wilson区间修正低频行为下的偏好置信度,这个就不展开讲了。通过这个修正,大家可以看到这个用户的显性偏好,其实是比较好理解的。这类修正方法在数据不足,频次较低的情况下是非常有效的。

在没有完善方法论的时候,可以通过统计用户在各个领域的购物频次、RFM的方法也能得到用户显性偏好的推断。但对于用户的隐形偏好,需要更深层的数据挖掘。

比如我们可以将总体平均显性行为作为先验概率,通过贝叶斯推断对比推断用户的后验隐性偏好。这就是我们通过用户与群体偏好对比推断用户隐形偏好概率的方法论。

四、区块链落地金融场景 为信用租赁免除后顾之忧

最后一个趋势,我刚才提到了去中心化。提到去中心化,大家第一个想到的就是区块链。但大家可以看到,区块链的应用并不普及,除了在币圈有诸多的应用之外,在信贷等金额场景没有看到很好的区块链落地应用,其主要原因之一是不能从根本解决上链数据真实性的问题。

作为京东数科消费金融信用管理部的负责人,我负责的一个核心业务就是我们的租赁业务。回顾过往的两年时间,共享经济的迅速崛起将一种全新的租赁模式普及到大众消费者眼前-信用租赁。相比传统租赁需要抵押、担保的方式,信用租赁直接将企业或者个人信用作为依据进行商业活动,这种模式会大大降低租赁产业的门槛。大家知道在中国整个现代消费产业升级重构的大环境下,信用租赁其实是共享经济非常核心的要素,为什么现在没有蓬勃发展起来,最核心的问题就是承租方和交易方双方建立信任非常难,这个过程中基于传统的公证流程会存在举证难、周期长、成本高、程序多等痛点,区块链作为新兴技术,其去中介化、开放性、自治性、信息不可篡改、匿名性等特征,自诞生起就在信用租赁领域产生了不小的触动。

在我们京东数科的租赁平台上面,当用户完成租赁下单后,可以看到“区块链防篡改电子数据保全已完成”的提示,用户还可以进一步点击进入查看区块链保全详情。若发生不可协商的纠纷违约,区块链记录的电子数据将成为各方可信赖的电子证据。

在保全说明栏中,基于京东内部可信节点和部分司法权威机构节点,在区块链网络下多方共同达成共识,保证存证结果的不可篡改性。

ZRobot通过京东智臻链区块链技术实现了信用租赁在信用和存证环节的技术落地,这也是目前信用租赁行业里面第一个区块链落地应用项目。我们期待未来随着区块链技术的应用日趋成熟,会对更多行业和领域带来更多革命性的影响。

我通过四个例子已经展示了四个趋势在我们公司以及整个行业中的各类应用,我也衷心希望能够跟在座的同仁、专家在不同发展领域可以展开更多、更深入的合作,共同推动中国金融科技的发展。

这就是我今天演讲的全部内容,谢谢大家!

分享到:0

发表评论

《清华金融评论》

微信订阅号

《清华金融评论》

扫码订阅

第 70 期

《清华金融评论》2019第9期

常务理事单位

理事单位


                                            
^
激活兑换码
关闭
请输入您的兑换码:
姓名:
单位:
职位:
邮箱:
手机号:
地址:
验证码:
激活
提示:
1、您的订阅周期将从兑换码被激活的当日开始计算。
2、同时激活多个兑换码,订阅期限会自动向后叠加。
3、如果您不想立即使用兑换码,可以在稍后任意时间激活,订阅码可赠予他人,但只能激活一次。
4、兑换码激活后,所绑定的授权用户仅限一人使用,不可多人分享账号。若发现违规使用,官方将做销号处理。