登录 注册 下载

宜信大数据 Joyce Zhang:大数据金融怎么做?

5 月 13 日,由 IDG 资本与创业邦携手举办的 IDG 校园创业大赛上海复旦大学宣讲会圆满落幕。本次校园创业大赛面对所有在校本科及研究生,旨在挖掘校园内的天才开发者和技术极客。宜信大数据创新中心总经理 Joyce Zhang 给大家分享了关于大数据金融方面的创业经历,并分析了应该怎样理解大数据 ?

 

以下是 Joyce Zhang 的演讲实录:

Joyce Zhang: 我今天讲的是大数据金融。我自己是去年加入宜信的,加入之前我没有听说过这家公司。他是一家不折不扣的创业公司,现在在全国已经有 30000 多人。宜信 06 年从线下起家,包括我们做风控,现在互联网金融很火,很多团队几十万买一个软件就做互联网金融的公司,20 多个人做这么一个公司,宜信做风控的有多少人呢 ? 加起来将近 2000 人,我们 CEO 是唐宁,他总是说风控是互联网金融的一个根本。我今天来的主要目的是讲宜信做大数据金融是怎么做的。我会和大家分享在美国还没有上市但是即将上市的大数据的信息。

之前,我们总听到互联网金融这个词。但是,这个词已经落伍了,现在是大数据金融比较火。我去年加入宜信很多我的朋友都跟我,你真会踩点,大数据这么火金融也这么火。我做大数据做了很多年从来不知道大数据会变得这么火,去年最厉害的时候我有 100 多个群,很多人把我拉进各种群,群里面有各种各样大数据群的名字。

怎样理解大数据 ?

在座的我不知道有多少人学计算机出身的,你们对大数据的理解是什么样的 ? 现在很多文章都在讲这个。我团队里面有个同事,他之前是创业的,后来我来了之后他跟我加入这个团队,在新浪微博最火的时候有几千万粉丝,我这个同事刚刚开始火起来的时候他们做了什么事情呢 ? 他们七八个人全部都是做技术的,没有一个做销售的,加上一个做产品的,他们用爬虫把全中文网上的很多文章,各种各样的文章扒下来,做技术学习和分析,分析后做什么呢 ? 他们在新浪微博大概总共开了 3000 多个帐号,比如 facebook 那些事、冷笑话诸如此类各种各样不同的主题不同的帐号,它扒来之后而且还要做缩略,新浪微博只能是 140 个字,还得显得是人写的,不能是机器写的,里面有很多技术难点。通过这样一个自动的流程把这个东西喂到 3000 多个帐号里面,高峰时期 3000 个帐号去重以后 8000 多万粉丝,其中将近 10 个月的时间还赚了不少钱,后来新浪不让做了就把他们给封了,所以还是要自己创业,中国很多所谓做平台的公司,比如 BAT 包括新浪,其实长久来说都不见得很可信。这个地方实际上是一个非常典型的大数据的例子,里面用了很多大数据典型的例子,比如做爬虫,拿来了之后用语音的分析、关联、抽取,放到新浪微博上之后还要分析那些转发,分析之间的关系,还有动态的去调整这个发的频率,这里面一系列都是有很多技术手段的。

讲完这个例子之后,我给大家分享三个在美国做得非常好的几个大数据金融的例子:

一个是 Zestf Inance,它是一个做风控的。他们做了好几年了,拿了很多投资,他们做的是一件什么事情呢 ? 这也是我来宜信做这个东西的信条之一,我觉得一切数据都是信用数据。它会把所有的到它这个地方申请贷款,把所有的在网上的信息,所有触摸过的地方,如果它曾经有些小的网站,把这些全部拿过来去分析,举几个非常有意思的例子:比如说在美国,其实美国人很多人也挺土的,尤其是中西部的一些人,文化水平也不怎么高。在美国如果你写你的东西,尤其我们这样还受一定教育的,你 J 会大写,这个其实可能我们在座的很多人不觉得是什么,但是是体现了教育程度的。在美国中西部很多人上去写全是大写全是小写,从前在传统的银行业他们不会给这个东西很多的关注,说这个体现了你信用的加权,传统的银行业做风控就几十个变量,这样的变量在那个里面都是忽略不计的,大数据做金融,包括我们团队在做的东西,我所有的数据统统扔进去,让机器自己去学习,也许学出来是几万个变量或者几十万个变量,我自己在这个地方做自适应做调整。

另外一家公司叫 Kabbage,Kabbage 是只做这种小的网店的店主,像电商那样的,因为在美国很多这些网店的店主,他在 ebay 他在雅虎,他卖给谁了,好评差评,他就会去关联所有社交的数据,包括这个企业主,很多很小的网站,虽然在 ebay 上非常小,但是他们都在 facebook 和推特上有自己帐号的,他们会把所有的这些东西拿过来之后,这些小企业主如果有自己的网站,一起关联起来做分析。这就是 Kabbage,它号称是 7 分钟放款,我上个月刚刚回美国,他说因为各种各样的原因,所以很多时候他们还是不能做到 7 分钟放款,美国的银行并不比中国高效多少。

还有一个 Lending Club,做的是 P2P 贷款,它把这些人群拿过来,关联所有在网上的信息,不一定是网上的信息,Lending Club 做的一件事情是别的人没有特别去做的,他们关联很多线下的信息,美国的邮政、超市,那种渠道买回来的信息,线上线下都会做关联,评出风险等级,这个人决定要不要投的时候可以去关注风险等级,这是三个在美国做得非常典型的大数据金融的案例。

我的团队来宜信做什么 ?

这么多年我在微软的时候做的是精准广告 + 内容推荐,来宜信后我的想法就是我用同样的技术手段来宜信做风控,风控是互联网金融的根本。现在中国很多互联网公司的状况还不是那么地好,所以需要这么高的成本。我们很多 90 后在迅速地成长,互联网的状况是在好转,所以我们还是在互联网、移动手机上有很多数据的信息可以做。

我今天没有办法分享太多,因为现在在座很多反欺诈的东西是不能分享的,反欺诈从来都是道高一尺魔高一丈。我们可以分享的是在座大数据所谓的风控决策引擎,另外一个是利用大数据实时授信。基于关键词的搜索,我们宜信老说这是一个金融公司,但是内部我们说这是一个屌丝金融公司,这些人在网上的信息是非常少的,谷歌在做这个东西,我们也在做,我们做的是长尾的,我们会把所有网上的信息拿回来之后加上我们自己的信息关联,加上第三方渠道合作的信息,做客户的画像,还做客户关系的关联,得出这样一个知识图谱之后,我去做风控或者我做决策引擎或者反欺诈或者推荐引擎。在座不知道有人用 51 信用卡这样的 app 吗 ?51 信用卡在中国号称有几百万的活跃用户,有几千万的注册用户,因为我有信用卡的流水,之后做机器学习的模型加上点上购买的记录,加上所有的社交信息,我们在做这样一个贷款。

分享到:0
^
激活兑换码
关闭
请输入您的兑换码:
姓名:
单位:
职位:
邮箱:
手机号:
地址:
验证码:
激活
提示:
1、您的订阅周期将从兑换码被激活的当日开始计算。
2、同时激活多个兑换码,订阅期限会自动向后叠加。
3、如果您不想立即使用兑换码,可以在稍后任意时间激活,订阅码可赠予他人,但只能激活一次。
4、兑换码激活后,所绑定的授权用户仅限一人使用,不可多人分享账号。若发现违规使用,官方将做销号处理。