文/中国人民银行征信中心博士后研究员刘新海
2015年6月25日,全球第三大个人征信机构环联(TransUnion)在纽交所正式上市,开盘当日即以日上涨13%结束交易。本文以环联为例,剖析大数据在全球个人征信机构的应用情况,为系统性地理解大数据征信提供一个视角。
由于征信的业务都是围绕着数据展开,因此大数据和征信有着天然的联系。随着全球商业机构清晰地意识到基于数据的决策和运营可以使公司获得巨大利润,以及消费者深入了解数据和分析对其享受产品服务和个人身份保护的重要意义,基于个人消费者的大数据及其分析市场的规模正不断扩大。国内市场化征信的启动,使大数据征信(或征信大数据)成为热点话题。据互联网权威咨询机构IDC估计,2014年全球在大数据及其分析上的投入大于520亿美元,2014—2018年的复合增长率将达15%。对大数据技术投入持续增长的基本原因包括以下几个方面:海量数据的不断产生;信息技术(IT)和分析能力的发展使数据的处理可以更快捷、更有效,可以为企业的决策和运营提供新的视角;在不同行业和区域中对大数据分析和决策业务的需求越来越强烈。
2015年6月25日,全球第三大个人征信机构环联(TransUnion)在纽交所正式上市,按其招股书中所言,环联是一个大数据公司。由于资本市场的普遍看好,该股开盘当日即以日上涨13%结束交易,高盛、摩根大通、美林美银和德意志银行等作为此次环联上市的发行商,目前环联的市值估价为45亿美元。本文以环联为例,剖析大数据在全球个人征信机构的应用情况,为系统性地理解大数据征信提供一个视角。
征信机构最基本的作用就是将分散在不同授信机构的碎片化的局部信息加工融合成为具有完整视图效果的全局信息,从中挖掘出风险信息,帮助解决交易过程中的信息不完整的问题,减少风险,降低交易成本,帮助商业机构更加有效地进行决策。大数据技术有助于对更加分散、碎片化、底层的数据加工处理成为更加完整的全局信息,更加有效地减少这种信息不对称。本文讨论大数据技术,不仅限于大数据存储和处理及目前流行的大数据风险评估,而是系统性地介绍征信大数据处理和分析的相关技术。
类比于矿物加工提炼过程,征信机构的业务流程可以理解为将征信数据提炼为信用信息的过程,包括数据采集(数据可以理解为矿石原材料,数据采集可以理解为挖矿,收集矿石原材料)、数据处理(相当于矿石粗加工,去杂,粗加工成基本原材料)、数据分析和挖掘(矿石深加工,按照一定的配方,由不同生产线批量生产出不同的生活用品和化工用品)以及数据服务(对产品进行质量检查,进行包装,提供给各种终端用户)。在大数据时代,大数据技术为征信发展提供了新的图景,如图一所示,大数据技术可以嵌套在整个征信的业务流程中,同时可以根据大数据服务的需求,不断更新和探索新的大数据来源。此外征信大数据的处理流程中的每一个环节都要兼顾数据质量、数据安全、消费者隐私保护和监管合规性的要求。
本文编辑/张浅