银行业应用大数据是大势所趋
早在2015年,国务院就出台了《促进大数据发展行动纲要》,其中强调:数据已成为国家的基础性战略资源,大数据日益成为推动经济转型和发展的新动力。2016年银监会发布的《中国银行业信息科技“十三五”发展规划监管指导意见》对银行业大数据发展提出要求:“主动制定大数据战略,积极建立大数据服务体系,加强数据共享,深化大数据应用,充分发挥数据价值”。
数据已成为银行业战略性资产
银行自诞生伊始就是靠数据驱动的行业,在经营资金和风险管理过程中,在内外部交易中积累了海量数据,每个员工都在从事数据采集、数据运用。但是,传统上银行对数据的应用更多是停留在事后的统计和经营分析,数据的价值没有得到充分挖掘,对大数据的应用能力亟待提升。
进入大数据时代,数据来源的迅速扩展,企业和个人的所有商业活动,包括金融活动,都可以实现数字化,银行可以通过更多领域、更深层次获得全面、完整和系统的数据,这些数据涵盖客户的各个方面;随着数据存储与分析技术的日新月异,深入分析这些数据可以获得更加准确、全面、及时的商机与知识。数据已经成为银行业一项重要战略性资产,数据分析对商业银行产品创新、客户营销、业务创新、风险管控以及内部考核评价等方面发挥的作用日益重要。数据的整合挖掘与应用能力已经成为商业银行核心竞争力的重要组成部分。数据驱动已经成为商业银行转型和发展的重要推动力。
大数据是银行推动战略转型的重要着力点
随着中国经济增长进入“新常态”,监管机构对银行业“去杠杆”监管政策的实施,银行业主要依靠扩大规模实现利润快速增长的时期已经不可持续。银行业正面临诸多挑战,如收入下降、利润增速下滑、资产质量恶化、客户资产多样化等,为应对挑战,银行业需要推进战略转型。发达国家银行业的成功实践表明,通过深入挖掘和分析客户切实需求,提供量身定制的综合服务,可以大幅提升银行的盈利水平。此外,运用客户舆情数据、交易行为数据,甚至是企业法人代表个人行为的数据,可以更为及时地发现企业存在的潜在风险,这比通过财务数据分析、线下客户调查等传统方法更加有效。国际领先银行经验表明,大数据应用可以有力推进商业银行的全面转型。
大数据日益成为银行营销、创收及风控等方面的利器
运用大数据构建客户的全景视图,使银行可以为客户提供量身定制的产品及营销方案。通过银行自身大量的交易信息,结合接入客户在社交网络、电子商务等平台上的结构化和非结构化数据,可以更好地帮助银行的产品设计,为客户提供更有针对性的营销方案。
提供与客户交易相关的大数据产品,拓展银行的非利息收入。当前,拥有海量数据的商业银行,不应满足于仅仅考虑如何运用大数据为传统的核心业务服务。实践表明,目前一些银行已经能够把大数据研发出数据产品,通过数据服务输出,实现数据能力变现,拓宽银行收入来源,实现商业模式的创新与转型。
运用大数据构建更有效的信用评价体系,提升银行风险识别与管控能力。商业银行是经营风险的企业,风险管控能力是其核心竞争力之一。银行可以运用大数据从以下两方面构建更精准的信用评价体系:一是构建更加完备的客户信用数据平台:基于银行掌握的海量客户信息、财务信息及金融交易数据,融合来自购物、社交、旅游等互联网平台提供的客户信用记录,构建完整、实时的客户信用基础数据库;二是逐步建立并改进客户的信用评价和风险监控模型。在大数据和人工智能技术快速发展的背景下,融合银行强大、专业的风险管理能力和客户在互联网平台、政府等公共服务平台上的丰富的客户行为信用记录,逐步建立并改进客户的信用评价、产品定价和风险监控模型。
银行在大数据应用中需要进一步加强的工作
虽然银行对应用大数据提升管理、助推经营转型已达成共识,但银行要真正应用好大数据,全面实现“信息化、数字化”银行的目标,仍有一些工作需要进一步加强。
要加强数据治理,夯实大数据应用基础
在大数据时代背景下,银行不缺少先进的算法,也不缺少数据模型,更不缺少分布式计算硬件,但数据质量问题可能会成为制约大数据应用效果最大的障碍。由于我国银行业信息系统普遍建设在不同的历史时期,各银行都不同程度存在系统整合、联动不足,信息共享和数据标准化不足,信息完整性和准确性不足等问题,导致银行拥有的大量数据质量普遍不高,使得数据应用的价值大打折扣。
近年来,各银行都在不断加强数据治理,提高数据质量、夯实数据基础。然而,相较于传统数据时代,目前银行所获取的数据来源更加复杂、形式更加多样、体量更加庞大,如何在大数据时代背景下解决好数据治理问题,是所有银行大数据应用者最关心的课题,也是大数据技术在银行业应用最有挑战的难题。数据治理之难不在技术,而在理念和管理,在流程和协同。
要提升战略高度。数据治理是一项系统工程,需要自上而下的指导和自下而上的推进。要将数据治理提升至全行发展战略高度,在全行发展战略框架下制定数据治理的战略,将全行发展战略作为数据治理的最高指导原则。
要形成治理文化。银行数据治理不仅是科技部门的事情,而应是全行的工作,需要全行上下各部门、各层级之间相互协作、相互支持,尤其需要加强业务部门和科技部门的合作,才能最终高质量地完成数据治理工作。在数据资产被高度认可和广泛利用的当下,数据治理应该成为一种企业文化融进每一名员工每一天的日常工作,通过建立以数据资产为导向的企业文化,将数据治理与信息科技治理、公司治理有机结合。
要加强组织和流程建设。随着数据治理工作被逐步重视,企业级的数据治理职能组织已经成为银行内部的重要组成部分,该组织不仅要行使数据管理职能,更要承担推进全行数据治理工作落实的职责。同时,数据治理工作相关的规范和制度也需要不断完善。目前,多数银行数据治理组织和制度由科技部门牵头,但从数据问题分析结果来看,业务部门作为产生数据问题的最初、最大来源以及数据结果最重要的使用者,需要深入参与并主动负责,保证数据治理工作的真正落地。
建立健全数据治理流程对于开展数据治理工作同样重要,要通过建立决策、沟通、监控、考核的完整有效机制,有效解决相关责、权、利问题,才能保障数据治理工作顺利推进。
要构建科学完善的数据管理体系。第一,要建立数据标准管理体系。建立数据标准体系是银行数据治理的重要前提,对数据进行标准化,是保障基础数据一致性、完整性和严密性的基础。为了确保各系统之间的数据一致性,要制定合理的数据标准、树立权威数据源、确定同步机制并严格执行。同时,为了保障业务系统能够采集到完整、真实、有效的数据,在系统设计初期必须通过数据标准对数据字段的定义、描述等予以前置性规范和约束。
第二,要建立元数据管理体系。企业级元数据管理是银行数据治理的重要载体,要以全行元数据管理为基础,将科学的方法和管理策略通过企业级的元数据管理体系实施和执行,再配以完善的组织流程和制度规范,有效提升数据治理的成效。
第三,要建立数据质量管理体系。数据质量管理是银行数据治理的目标和生命线。需建立专业的质量管理团队,依靠科学的质量管理工具和系统持续地管理数据质量,利用数据剖析工具持续地监控数据的流向,通过明确的数据责任归属关系,尽可能将数据问题消灭在源头。
第四,要建立数据生命周期管理体系。通过对数据生命周期进行体系化管理,可优化数据应用存储架构,有效控制热数据、温数据、冷数据的规模比例,提高生产数据访问效率,合理分配系统资源,提高应用系统运行效率,保证应用系统健康高效运行。
第五,要配套系统支撑和技术手段。数据治理工作是一项透过数据看本质的工作,其自身也是一种数据应用,为保障数据治理工作高效有序的开展,必须配套先进的技术手段和支撑平台。
加强技术运用,全面构建大数据体系
大数据技术的高速发展和日益成熟,客观上为银行应用新技术构建大数据体系提供了更有力的工具。但环境的变化和技术的进步,银行自身对大数据应用的需求、大数据的应用特点也在不断变化,对技术而言从数据采集、数据存储、数据处理、数据分析和数据使用等各个环节都提出了新的要求和挑战。银行技术部门需要积极应对这些新要求和新挑战,开展前瞻性的技术布局,提升技术运用能力,构建科学完善的大数据体系。
数据采集。当前随着银行业务对数据的依赖程度提升,数据需求的特点也发生了显著变化,突出体现在“实时性”“过程性”“多样性”和“随机性”。其中,“实时性”要求银行的技术平台必须解决好对金融交易、线上线下客户服务、客户操作行为等实时变化数据的采集。“过程性”要求尽量采集内部管理过程和对外服务过程中的数据。“多样性”体现为对于非结构化数据的运用需求越来越多,接入语音、图像、文本、网页等异构的数据源成为基本能力。“随机性”代表着业务需求方的需求变更更加频繁、不可预测,要求技术平台尽可能多地将未来可能用到的数据资源采集起来。
数据存储。银行数据存储方面,传统以结构化数据存储为主的发展模式正在发生变化。分布式技术平台的发展,为银行存储更多的数据资源创造了可能性,也给银行数据资产构成带来两个方面变化:一方面银行数据资源不仅存储结构化数据,而且需要存储各类非结构化、流式数据;另一方面为适应“全数据”使用要求,银行数据存储周期变得更长、数据存储内容变得更全,这对银行数据平台存储容量和管理能力带来更大挑战。
数据处理。银行数据处理方面,传统银行数据被认为必须保证“高精度”。随着大数据分析方式的引入,一些特定的场景中数据精度不再是影响应用效果的决定因素,更多、更全的数据对于应用结果显得更加重要。比如,在客群产品推荐场景中,数据精度放宽到百元对于分析结果几乎没有影响。这种情况为银行在原数据平台之外搭建一个“短频快”的数据处理平台带来可能性。另外,在银行数据处理技术方面也在发生着巨大变化,数据库模型设计对范式要求降低,数据表变得越来越“宽”;数据计算时效性要求的优先级提升,数据冗余的接受度增加;非结构化数据处理要求增加等。
数据分析。随着大数据分析进入2.0甚至3.0时代,银行对大数据分析的认知和要求不断深入。在数据分析的工作组织层面,除了培养专业技术人员以外,部分银行已经开始建立敏捷式数据团队,数据分析与一线业务结合得更加紧密,数据工作灵活机动性大大增强。在数据分析技术支撑平台方面,近年来银行IT架构纷纷进行了扩展,基础平台中大量出现分析计算平台和智能化引擎等构件,深度学习、机器学习、知识图谱、流计算等平台的重要性日益显著。
大数据使用。在大数据氛围的烘托下,银行内部的数据使用热情高涨,用户群不断扩大。大数据价值的发挥,需要数据资源的充分开放、共享,构建开放、共享、安全且可按照不同用户特点定制化的数据平台,成为银行用好大数据的前提。可以预见的是,未来银行在数据使用过程中一定会出现数据需求越来越复杂、数据流转越来越快、应用场景越来越多的情形,银行数据平台需要在易用性、可靠性和混合负载能力等方面多下功夫,尤其需要保持持续的迭代优化能力。
对银行业大数据应用的相关建议
银行业在大数据应用中要贯彻金标委的大数据标准
随着金融信息化的快速发展,金融数据共享、业务协同的要求越来越高,与金融相关的数据需要跨行业、跨地域及跨部门的传输和共享,这要求数据的采集、传输、存储、处理等一系列环节的使用者对相关数据的含义、标识理解要统一,即建立统一的数据标准,全国金融标准化技术委员会肩负起了这一重任。截至2016年7月,全国金融标准化技术委员会组织行业大量资源发布了金融标准共279项,包括金融国家标准78项,金融行业标准201项。其中与金融数据相关的标准100余项,其中涵盖分类编码标准、元数据标准和交换标准等三类。在这些金融数据标准中,分类编码标准对金融大数据中涉及实体的分类信息和编码活动等进行规范,交换标准对金融大数据交换的报文规范及报文的传输活动等进行规范,元数据标准对金融大数据中除分类编码标准外的元数据标准等方面进行规范,主要包括金融数据元、金融相关术语以及各种金融指标体系等。建议在政府部门、金融同业及相关社会组织中加大推行这些金融标准的贯标力度,提升大数据应用的社会基础,降低大数据应用和运营成本。
稳步推进政府和互联网信息共享利用,促进银行业大数据应用和社会信用体系建设。
如前所述,从另一个角度来讲,银行是经营信息的公司,各银行虽然掌握了客户的基础信息和相关的资金交易信息,从总量上看,这些数据的规模已经很“大”了,但是与银行客户相关的大量有效数据更多是分散在银行之外不同行业、不同区域、不同平台之中,其中政府相关部门拥有的企业和个人有效数据信息占比达80%以上。为此,国务院于2016年出台了《政务信息资源共享管理暂行办法》,指示要加快推动政务信息系统的互联和公共数据的共享,要求各部门的政务服务信息系统与国家数据共享交换平台尽快实现对接,从而通过统一的共享平台实现信息共享。各部门积极响应,逐步形成了个人征信和公民身份核查以及企业工商登记注册信息查询等共享平台,发挥了积极重要的作用。建议在明确授权,管控好客户信息安全的前提下,进一步推进企业和个人财税等信息数据与金融机构的双向开放共享和统一服务平台建设,这将有助于金融机构获得更加全面准确的客户数据信息,企业和个人可以更加便捷地获得银行等金融机构的金融服务,也有利于建立并完善我国统一的个人以及法人和其他社会组织的社会信用体系。
(牛新庄为中国民生银行信息科技部总经理。本文编辑/丁开艳)