中国互联网个人征信机构差异分析与合作模式探讨

2015年9月9日 (上午11:16)2,322 views

作者:清华金融评论

分类:互联网金融, 互联网金融-总22期, 总22期, 清华金融评论杂志文章

标签:无

评论:没有评论

文/北京大学国家发展研究院教授唐方方

本文对五类不同平台支持下的互联网个人征信机构进行了对比分析,结合美国个人征信的发展历史,探讨了中国互联网个人征信行业的合作模式。

互联网个人征信平台

互联网个人征信是信用评估的一种重要模式,它通过采集个人在互联网交易或使用互联网各类服务中留下的信息数据,并结合线下渠道采集的信息数据,利用大数据、云计算等技术进行信用评估。其中,数据类型的多样化、评价体系的完备化、数据处理的高效化等,都是互联网金融为征信领域带来的全新机遇。

相比于企业征信而言,个人征信牵涉的信息更多样化、碎片化,社交资料、网购记录、通讯信息乃至快递签收情况都可以成为有价值的信用评估依据,且个人征信所涉及的个体数量远大于企业征信,产业拓宽空间大。

2015年1月5日,我国央行批准了8家民营征信机构个人征信业务试点。随着新的个人征信平台出现,我国个人征信机构可以划分为基于电商平台、社交平台、金融平台、支付端、公共服务平台的征信机构这五类。

电商平台中最有代表意义的就是阿里旗下2015年1月28日正式开始试运行的芝麻信用。另一个典型的机构是京东金融。京东错失了央行公布的8家个人征信业务的首批试点,虽然推出了京东白条,但与完整的个人征信业务还有一定距离。社交平台的典型产品是腾讯旗下的腾讯信用,它是腾讯的全资子公司。基于金融和保险平台的征信机构是征信行业的先行者,如中国平安集团旗下的前海征信等,金融背景的征信机构运营模式相比于其他机构更为传统。

基于支付端的典型征信机构则是拉卡拉旗下的考拉征信,其在数据的流入和流出这两端相比其他平台更有优势,但是在数据信息处理方面则需要与其他公司合作。其他类似支付端的征信机构中具有代表性的还有华道征信。

最后,公共服务平台的征信机构虽然也是民营的个人征信,但官方色彩更突出一些。这一类机构与国企的关系往往比前面的机构密切很多,如中诚信征信、鹏元征信和中智诚征信。

不同平台支持下个人征信机构的差异分析

信息来源上的差异

征信机构的信息来源主要是自己积累的数据和向其他企业或机构购买或合作得到的数据,但是不同机构在信息来源上的比重会有很大不同。对于外部数据获取,五大类征信机构往往采用自下而上的策略,优先考虑商业公司的数据,再考虑使用政府部门提供的信息,其原因则是,对于电商或者支付端而言,本身已有的合作商家数量众多,商业信息的成本相对于政府部门的信息更加有竞争力。

数据类型上的差异

腾讯虽然只依托社交平台的数据,但其数据类型非常丰富。任何事物都有两面性,类型丰富既有优势也有劣势:一方面,类型复杂度的提升确实对统计方法和机器学习都十分有利,尤其是在通过人际关系来评估信用时;另一方面则是数据质量的问题,大量的数据中会有许多干扰因素,导致数据指向性不集中。一个典型的例子就是腾讯的“小号现象”十分严重,不仅稀释了数据质量,而且使得匹配效率也大大下降,以至于腾讯征信需要通过人脸识别等更为复杂的技术来进行匹配,这大大地提高了成本,并且这套技术至今也没能落地推广。

相比之下,中诚信征信的数据类型更传统一些,且丰富度没有那么高,虽然其因半官方的地位拥有广泛的信息来源,但这些信息本身的类型并没有脱离传统征信的框架,主要是常见的电子消费、银行信贷等信息。

信息处理上的差异

在信息处理的方法上,可以发现不同的征信机构采用的算法与平台类型并不直接相关,而是与上文所提的数据类型密切相关。最典型的是社交平台的代表腾讯征信,由于其数据点多而且数据结构不整齐,所以机器学习和数据挖掘的方法就显得非常必要。此外,从单一交易数据转向复杂结构数据的电商平台的征信机构,数据处理上也发生着相应的改变。以芝麻信用为例,蚂蚁金服首席信用数据科学家俞吴杰表示:“芝麻信用的评分模型类似于银行的违约概率模型,以线性回归和逻辑回归为主;对于日趋复杂的数据结构,他们也开始使用决策树分类、神经网络等机器学习技术。”然而,金融系的个人征信机构则与前者的方法有更多不同,它们大多秉持以风险控制为主的建模思路,数据处理相对传统一些。

服务输出上的差异

对数据流出的分析主要是比较输出服务的广度。人们可以发现这些征信机构分别显示出两种明显不同的趋势:以金融保险、公共服务或支付端为依托的征信机构普遍将信用服务的输出锁定在贷款上,无论是面向小银行、个体网络借贷(P2P)、小贷公司还是其他金融机构,主要是帮助它们更好地放贷;而电商和社交平台的个人征信业务就是另一番景象了,因为这些机构背后的平台本身已经拥有相对完整的产业圈,所以个人征信业务扮演的角色其实是和这些平台已有的产业链串联起来,或者充当一些企业合作的棋子。比如阿里旗下的芝麻信用就通过将信用数据部分提供给租房、租车、征婚、旅游商务这些领域的互联网企业,来进一步拓展自己的圈子。

收益渠道上的差异

在收费渠道这一方面,需要考虑两个问题:其一是收不收费,其二是向谁收费。总体来说,不同征信机构的选择与其依托的平台表现出明显的关联。目前,电商平台的芝麻信用以及金融平台下的前海征信都是不收费的,其原因可能是电商和金融平台需要的是使用者的黏性,尤其是获得合作商户的使用偏好。芝麻信用对于这一问题的答复是:“目前公测期间对合作商户暂时不收费,未来商户对‘芝麻分’进行检验并意识到它的价值后,才会考虑收费方案。”然而,中诚信、考拉征信等机构的模式就是明确向B端即使用企业收费,因为这些机构背后的平台合作关系是比较稳定而明确的,比如中诚信一般和大型国企打交道,基本不存在用户黏性的问题。

综合以上五个角度的差异分析,可见不同平台支持下的互联网个人征信机构间有着多元化的差异。表1通过列举关键词的形式,简要概括了各类机构在不同维度上的差异。

2342342

0150909170310

中国互联网个人征信机构的合作模式探讨

美国征信行业经历了快速发展期、法律完善期、并购整合期以及成熟拓展期四大发展阶段,已经形成了较完整的征信体系。这为我国个人征信业发展提供了参考样板。

美国的信用体系主要由三部分组成:一是比较完善、有效的信用管理体系,二是市场化运作的信用服务行业,三是涉及经济与社会各个层面的庞大信用产品用户。在美国,个人信用体系已经超出商业活动的范畴,成为一种保障经济运行的重要社会制度。在某种程度上讲,信用实质上已经成为一种商品,美国的个人征信机构都是从营利目的出发,向社会提供有偿服务,完全实行市场化运作。目前,消费信贷已成为美国人基本的消费方式,连年出现居民零储蓄现象。

相较于我国情况,美国社会对于“信用”已形成较为成熟的认识。个人信用的“5C1S”定义,即品德(Character)、能力(Capability)、资本(Capital)、条件(Condition)、担保品(Collateral)、稳定性(Stability)得到较为广泛的认同。同时,信用的边界也得到了明确的界定,即对于用来量化信用的数据基础形成了共识。

不同于我国征信系统由央行负责,在美国负责收集消费者个人信用的是信用局。这是专业化的个人信用服务公司,它的基本工作就是收集消费者个人的信用记录,合法地制作消费者个人信用调查报告,并向法律规定的合格使用者有偿传播信用报告。

美国全国性的信用局主要有三家:Experian、Equifax和TransUnion,几乎垄断了全美个人征信数据。这三家公司对全美消费者的信用状况进行调查记录,然后通过公司建立的庞大数据库将信用报告有偿传递给全美各地的合法客户。银行等金融机构可以随时向信用局索要消费者的信用报告,了解客户的信用状况。而雇主、房东等个人和机构也会在与个人签订相关合同前查看其信用记录,因此,美国人一旦信用出现不良记录,不仅会影响其贷款等金融活动,还会严重影响其职业生涯和日常生活,所以美国人都非常注意保持信用的良好度。

信用局提供的信用报告主要包括以下四方面的内容:1. 个人信息,包括消费者个人的姓名、社会保险号、生日、家庭现住址、家庭原住址、工作经历和雇主信息等。2. 信用记录,包括信用卡、房屋贷款、分期贷款、账号、状态、开户日期、余额、信用额度、最少还款额度、最近更新日期、还款历史记录,以及最近30天内或更长时间的支付行为记录。3. 查询要求分为硬查询(Hard Inquiry)和软查询(Soft Inquiry)两种。前者指消费者本人授权银行或信用卡公司进行的查询,对信用记录评分有一定的负面影响;后者指其他类型的查询—如自行索取报告、信用卡公司准备做促销活动而进行的查询,对信用记录评分没有影响。4. 公共记录,包括所有涉及消费者个人破产、抵押冻结资产以及离婚赡养权协议和税收留置权等法庭判决。

征信机构采集数据后一般都采用FICO评分模型对数据进行处理以获得用户的信用等级。FICO评分模型中所关注的主要因素有五类,分别是客户的偿还历史(35%)、信用账户数(30%)、使用信用的年限(15%)、正在使用的信用类型(10%)、新开立的信用账户(10%)。在美国,99.9%的个人用户用FICO查询房贷、车贷和个人信用记录,获取FICO评分。此外,FICO也针对没有信用记录或者记录比较少的人制定了非传统的数据拓展评分模型。

对金融机构而言,一个FICO信用分数往往不能完全满足其使用要求,它们往往需要客户财务往来的更多细节内容。对每一个账户,Experian可以提供1300个不同方面的信息,称为信用属性(credit attributes),而TransUnion只提供700个左右的信用属性,Equifax可以提供850个信用属性。除财务信息外,各信用局还提供各种身份检验分数,著名的有Experian 的Precise ID Score,它根据客户申请开户时提交的个人信息,如姓名、性别、年龄、家庭住址、联系电话、职业、驾照、身份证信息等,和其数据库记录的信息进行比较,以核实客户提供的信息真实有效,不是冒用他人信息,非常低的分数意味着申请开户者提供的个人身份信息不实。除信用属性和FICO以外,各大局都根据客户需求,提供客户专用的信用产品,比如Experian专门针对富国银行(Wells Fargo)的信用卡账户设立的信用分数称为EPD Score 。

通过上述的分析,可见中美两国的个人征信业在合作这一点上有异有同。一方面,我国目前的情况与美国20世纪后半叶的情况类似,法律正在完善,市场中不同的征信机构间互补程度高,相当一部分征信机构所拥有的信息重合度不大,这使得机构间的合作或兼并势在必行;另一方面,我国征信机构目前所掌握信息的差异主要在于个体信用的不同侧面,而彼时美国的行业发展特征是地域上的整合—由于个人征信机构掌握的是各自地域性的数据,信息技术成为了不同地域间合作与整合的一大推动力。

换言之,中国的个人征信机构了解“许多人的一个侧面”,整合前的美国征信业中的机构了解“一些人的许多侧面”。

也正是基于此,单纯为个人征信贴上“互联网+”的标签恐怕不能为中国个人征信行业提供进一步合作的激励。要把“许多人的一个侧面”整合起来,需要的其实是一种共识,即个人信用究竟应当从哪些侧面来进行考量。美国的三大征信局体系中,Metro 1 及 Metro 2 这两种标准格式所起到的作用是不可忽视的:它们使得个人征信机构能够在一个统一的框架下布局个性化的业务,即规定了一些“标准侧面”,使得个人征信行业有了基本的共识。类似地,如果中国个人征信行业能尽早拟定一种行业规范格式,对数据的采集格式、评价的基本维度、信用报告的规范格式和产品差异化的界限加以厘清,则有相当大的可能为各家征信机构提供合作的激励,尤其是整合不同侧面的数据与合并重叠的服务输出渠道的激励。(北京大学学生胡禛、张毅良、张欣勃 ,中国传媒大学学生余萧雨、季欣对本文有贡献。)

本文编辑/张浅

上一篇:传统个人征信机构的大数据征信——以环联为例(上)
下一篇:关于基本养老基金市场化运作的几点思考

管理日志

  1. 首页
  2. 登录