深圳大数金融融贷款要多少手绩费

日07:23&&&&&&&&
本报记者 卓尚进&&&&&&&&来源:金融时报
  互联网金融搜索平台融360日前宣布,融360与蚂蚁金服旗下的第三方征信机构芝麻信用已经建立了数据上的战略合作。这是融360在今年5月初成功开发和运用“天机”大数据风控系统之后在探索互联网大数据征信实践上的又一进展。
  融360负责风控的副总裁李英浩向记者描述了通过大数据征信将使在线小额信贷迅速发展的前景。他说,假如你需要5万元左右的资金短期周转,不必再劳时费力去银行或小贷公司申请了,只需要靠自己常年累月攒下来的信用,凭借第三方征信公司提供的信用分,就可以在融360等在线金融平台上贷款了。而且最快10分钟审批、24小时放款,省时省力省成本。由于大数据风控的运用,未来小额信贷的应用场景将发生极大的变革,将近万亿元的小额信贷市场因此正在成为各大在线金融服务商争夺的潜在市场。
  今年年初,央行已印发《关于做好个人征信业务准备工作的通知》,要求芝麻信用管理有限公司、腾讯征信有限公司等8家机构做好个人征信业务的准备工作,准备时间为6个月。业内人士预计,到6月底,经央行批准后,这8家民营机构将有望获得筹建第三方征信机构的资质。 
  现在融360与芝麻信用建立数据上的战略合作,无疑将有助于双方的优势互补,在开展互联网大数据风控和征信业务实践上取得较快进展。李英浩表示,融360拥有丰富的用户借贷行为数据,结合芝麻信用的征信数据(个人信用数据),使得融360的“天机”大数据风控系统更加高效,对借款人可以很快地计算出放贷金额。
  据了解,芝麻信用推出的中国首个个人信用评分“芝麻信用分”,主要接入了阿里巴巴集团的电商数据和蚂蚁金融的互联网金融数据以及公共机构的数据,运用大数据及云计算技术,客观评估并呈现出个人的信用状况。
  芝麻信用采用国际上通行的信用评分方法,最低350分、最高950分,这与美国FICO分(300分至850分)相似,分数越高代表个人信用程度越好,违约可能性越低。该服务主要包含了用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度。人们在日常生活中点点滴滴的行为,通过长期积累,这些行为轨迹和细节,可以全面反映其信用状况。
  统计数据显示,截至2013年底,央行银行个人征信系统中收录有信贷记录的自然人约3.2亿,还不到全国总人口数的1/4,远远满足不了借贷市场的需求,很多没有信用卡或从未跟银行发生借贷关系的人群很难获得信贷服务。而在美国,征信体系的覆盖率已经达到了85%。
  商业大数据征信的兴起,将改变这一状况。融360的创始人、CEO叶大清向记者表示,“2015年是互联网征信元年。6月份8家商业征信公司将有望拿到央行颁发的牌照,补充央行征信记录的不足。”他透露,融360正广泛地和国内外各类征信机构洽谈合作,其中一些合作项目已经启动。商业征信数据结合央行征信数据,能够让广大草根人群,例如自由职业者、个体户、小微企业主、学生等人群有机会在线借贷。
  芝麻信用相关负责人表示,芝麻信用分主要分为金融和非金融两类应用场景,非金融会在免押(租车、住宿)、后付、证明(签证、交友)、分享经济(比如小猪短租)方面加大投入。而金融类则需要加强同相关借贷数据提供方合作。在线金融搜索平台融360独有的数据源是芝麻信用一个天然的合作伙伴。
  据了解,融360过去三年半积累了大量的信贷用户数据,帮助用户成功获取了超过3000亿元贷款。在借款人访问数据、用户申请资质信息、网站行为数据、批贷信息和贷后信息方面拥有强大的优势。
  业内人士认为,未来无论是用芝麻信用,还是融360的大数据风控服务,5万元以下的小额贷款申请将有可能完全在线化,不再需要人工的审核流程,因而速度将极大地加快。李英浩介绍说,人工审核一般需要一周以上才能放款,慢的可能两个月;纯线上审核可以做到10分钟以内。这将意味着贷款在线化有望很快得到大规模普及。
  据介绍,除了贷款审批速度实现了突破,贷款获批率也得到了显著提升,同一类用户,用抵押物、收入流水证明等粗放式的传统风控方式,贷款获批率在15%左右,而使用大数据征信结合人工操作后获批率可以达到45%以上。至于贷款的逾期率,以12个月违约风险举例,通过“天机”风控模型筛选的用户,逾期率比没有经过筛选的低一半。
相关附件:
&(您填写的用户名将出现在评论列表中) 匿名TOP热门关键词
专题页面精选
高手弈棋都十分讲究布局,马云亦如是。依靠此前布下的交易平台,阿里旗下的支付宝,已经成为第三方支付领域的统治者;后又依托电商积累的信用数据,再落一子——阿里小贷迅猛崛起。2012年8月,阿里金融旗下的信贷产品 ...
高手弈棋都十分讲究布局,马云亦如是。依靠此前布下的交易平台,阿里旗下的支付宝,已经成为第三方支付领域的统治者;后又依托电商积累的信用数据,再落一子——阿里小贷迅猛崛起。2012年8月,阿里金融旗下的信贷产品开始面向阿里巴巴普通会员放开,同时和平安集团合作成立新公司从事网上保险业务。据阿里金融数据显示,截至2012年底,该公司累计服务的小微企业数量已经超过20万家。在过去两年中,阿里金融几乎保持着每年100%以上的增长速度。从交易平台到支付平台再到金融平台,马云一直梦想着构建一个强大的网络金融帝国。目前有一些专家认为,互联网“类金融”公司正在搅动传统金融业格局。马云之手不仅于此。2012年9月,阿里集团完成了雅虎76亿美元的股份回购计划,国家开发银行为此次交易提供了10亿美元的银行贷款。马云并借此引入了中投公司和国开金融。引入后两者的意义,不在于简单的资金相助,更为后续金融政策的支持埋下伏笔。打造金融平台日下午14:23,阿里员工收到了马云一封名为“变革未来”的邮件。邮件中,马云宣布,阿里巴巴集团现有业务架构和组织进行调整,成立25个事业部,事业部的业务发展将由各事业部总裁负责。不过,对于外界巨大想象空间的支付宝和阿里金融,马云声称将在之后另行调整。电子商务观察员鲁振旺在接受《财经国家周刊》记者采访时预测,未来阿里金融或将与支付宝进一步融合。鲁振旺表示,阿里金融的放贷额度受到资本金限制,而支付宝却有大量的沉淀资金。如果二者进一步融合,将在盘活沉淀资金、扩大放贷额度方面做出有益尝试。但他也表示,在目前的监管条件下,这一步很难。“阿里金融目前还是在独立运行,会有下一步调整。但是否会并入支付宝,现在还不好说。”阿里公关总监杨磊在接受媒体采访时表示。市场的另一个版本是,“支付宝未来或与阿里云合并,探索银行业务。”当市场的猜测还在发酵之际,1月15日,马云又宣布,从5月10日起,将辞任阿里巴巴集团CEO一职,只保留董事长职务,新任CEO将在日后公布。一时间,马云卸任的原因甚嚣尘上。“马云可能在日后集中精力拓展金融业务,将金融打造成集团的支柱之一。”阿里集团的一位内部人士在接受《财经国家周刊》记者采访时透露。其实,早在2012年的网商大会上,马云就宣布,阿里巴巴将从日起转型,重塑为平台、金融和数据三大业务。当时马云就曾表示,平台之后,他想做金融,最后做数据,数据就是经济气象预测台,可以提前预知经济形势的变化。2012年,阿里巴巴集团完成了“七剑下天山”,分拆成了阿里巴巴国外、阿里巴巴国内、一淘、淘宝、天猫、聚划算、云计算等七大业务,也组合成了一个无所不包的电商大平台。马云希望这个平台在10年后能够承载10万亿元的交易规模,是目前的10倍。在做大平台基础上,阿里金融已经呼之欲出。鲁振旺表示,支付宝和阿里金融的崛起,有助于马云依托交易平台,更好掘金。同样,也有助于阿里集团从电商的角色脱离出来,成为更广泛的平台。依托交易平台,马云涉水阿里金融两年就取得了市场瞩目。截至2012年6月末,阿里巴巴旗下小贷公司的阿里金融,贷款总额超过260亿元。而当年的7月20日,阿里金融已经实现单日利息收入100万元。也许,正如马云在邮件中所述,阿里提出建设商业生态系统而不是商业帝国。他希望营造一个生生不息态势,让自己的每个棋子都变成棋盘,不断循环下去。阿里金融则是其中重要一环。宝贵的信用数据库上世纪末,在杭州刚开通拨号上网时,马云就创立了B2B的网上交易平台——阿里巴巴。当时的阿里巴巴仅是一个展示商品的平台,鱼龙混杂。商户与买方难以建立信任。为了解决网络贸易的信用问题,2002年3月,阿里巴巴推出了为中小企业量身定制的“诚信通”。该产品宣称,通过独一无二的第三方身份认证,拥有诚信通档案,赢得买家信任。随着网络贸易的发展,两年之后,阿里巴巴又推出了“诚信通指数”,用于展示企业的网上信息公开度和贸易成熟度,成为企业之间相互了解和选择对方的一个重要参考。截至2011年底,阿里巴巴注册会员突破5000万,其中“付费的诚信通会员已经近100万”。前述阿里内部人士对本刊记者表示,在诚信通数据库中,最长的信用记录已经六年多。“因为线上交易,所以商户的所有行为均被记录。包括什么时间,做了什么生意,发货到哪里,现金流多少等等变化情况,阿里巴巴都有相应数据存在。”前述内部人士表示,因为该类原始数据基本不可能造假,所以绝大多商户的信用记录是可靠的。信用评估是现代金融业发展的基础。目前国内只有央行拥有金融信用信息基础数据库。而阿里巴巴这一民营企业,却利用网络交易平台,将自己的诚信数据做得如此出色,这也为阿里金融的崛起打下了基础。当阿里巴巴开始盈利之际,2003年5月在位于杭州的马云公寓里,B2C网站淘宝成立。为了解决网络交易安全,2004年底马云又落一子,创立了第三方支付平台——支付宝。马云的开篇布子,看似单摆浮搁,实则丝丝入扣。在拥有用户信用数据库和支付宝的基础上,马云也开始暗中运劲,伺机染指金融。海量的网络信用数据,成为了马云进军金融的核心竞争力,也入了建设银行和工商银行的法眼。两大银行巨头心中清楚,一个涵盖了数十万家企业的信用数据库,能产生多大的价值。如果银行能共享该数据库,这将给他们甄选贷款企业带来极大便利,且大大降低坏账风险。在此后的时间里,阿里巴巴与建行、工行高调合作,宣布向会员企业提供网络联保贷款,无需抵押。该类产品由3家或3家以上企业组成一个联合体,共同向银行申请贷款,同时企业之间实现风险共担。阿里巴巴将提交申请的会员信用记录提交给银行,最终由银行决定是否发放贷款。不过三年后,由于建行拒绝了阿里巴巴在贷款利息收入中分一杯羹的要求,二者罅隙渐生,最终分道扬镳。这项被誉为金融业和电子商务业经典合作的范例,也走到了尽头。但是在此次试水期间,阿里巴巴构建了自己完整的信用评价体系和数据库,应对贷款风险的控制机制。甚至借助平台进行风险控制,尝试公布会员的不良信用记录。小试牛刀擅长围棋的马云,参悟最深的或许就是“时机”。在试水金融获得经验之后,马云正式踏足金融领域的“时机”终于来到。2010年6月,浙江阿里巴巴小额贷款股份有限公司正式成立,注册资本为6亿元,是全国范围内首家完全面向电子商务领域小微企业融资需求的小额贷款公司,也是全国首个电子商务领域的小额贷款公司。时隔两年,重庆市阿里巴巴小额贷款股份有限公司在重庆两江新区正式揭牌,其放贷对象是淘宝和阿里巴巴卖家,主要提供50万元以下的小额贷款。该小贷公司宣称,申请贷款流程实行全网络化无纸化操作,足不出户在3分钟内就能完成。2012年底,一则新闻席卷了广东的小贷圈子——阿里小贷可能会把第三家公司落在广州,并将在整个广东省范围内开展业务。对此,广东小贷圈子忧心忡忡,担心这个小贷大鳄带来的冲击。“就是一个普通的小贷公司,没有媒体渲染得那么夸张。”阿里公关的一位人士对记者强调,“2012年上半年阿里金融仅放贷130亿元,比不过任何一家国有银行的浙江分行。”这130亿元的贷款,由170万笔组成。有人算了一笔账,2012年阿里小贷日均完成贷款近万笔,平均每笔贷款仅为7000元。“这是银行所不愿意受理的小额贷款,收益太少,成本却很高。”中国社科院金融研究所银行研究室主任曾刚在接受《财经国家周刊》记者采访时表示。阿里金融通过互联网技术,加上平台信用数据积累,正在打造一条“小贷流水线”,以期融资服务实现标准化工业生产,降低成本并确保质量,最终建立互联网式金融的小贷工厂。“阿里贷款主要是依托信用数据积累。”曾刚认为,阿里金融依托淘宝、阿里巴巴、支付宝等平台开展业务,一是目标客户清晰,有稳定的客户源;二是客户在网上积累的信用数据和行为数据完整,信用分析可靠,风险可控。阿里小贷的部门设置中,负责贷款的主要是淘宝贷款车间和阿里贷款车间。淘宝贷款服务的是淘宝和天猫平台的卖家,阿里贷款的对象是B2B平台上的小公司。根据互联网客户的需要,阿里小贷目前主要提供订单贷款和信用贷款两种产品。订单贷款主要是,商家发货后还未收到货款,就可申请此项贷款,基本上等同于订单质押贷款。“信用贷款仅以卖家在淘宝网或天猫网上的网络行为数据做一个综合的授信评分,凭信用拿贷款,无需抵押物和担保人。”北京一家网店店主暖月说。她在淘宝上开店已经五年,2012年“双十一”促销期间,找过阿里小贷贷款。她对记者描述了信用贷款的经历。首先网上递交贷款申请表,随后与阿里金融视频交流,补交个人银行流水、水电费单。阿里金融再联系客户和供应商,进一步核实了店铺的运营情况,第三天就通过支付宝拿到了5万元的贷款。阿里巴巴凭借互联网技术不但在线上审核发放贷款,还能在一定程度监控贷款的流向。“如果该客户是贷款用于扩展经营,阿里小贷的风险管理车间将会对其广告投放、店铺装修和销售进行评估和监控。”前述内部人士对记者表示,如果一旦发现该客户的贷款使用情况出现偏离,就由催收和资产保全部门做出预警并且提前收回贷款。严重者甚至将受到关停店铺的惩罚。据悉,2012年阿里小贷的不良率始终控制在1%以下。阿里金融局中局马云公开表示,在过去两年的试验中表明,阿里金融的几百名员工,完成了15万家企业的贷款,平均每家企业贷款金额是4.7万元。阿里金融的负责人胡晓明曾表示,银行每位客户经理能够管理100家小微企业,已经是极限,我们力争最终每人管1000家以上,这才是真正的信贷工厂。“马云说过一句话,就是支付宝其实是一个毛细血管,主动脉是现有金融机构,阿里金融主要去服务后者服务不到的地方。”阿里集团内部的一位产品总监在接受本刊记者采访时说。根据宜信公司最新发布的《2011小微企业调研报告——经营与融资》显示,多数小微企业的资金缺口较小,受访者中有64%表示其日常资金短缺额度在10万元之内,94%的企业资金短缺额度不超过50万元。但是来自央行的数据显示,2012年仅有8%的小微企业通过银行获得了贷款,缺少抵押物或担保是主要限制因素。鲁振旺给本刊记者算了一笔账,中国目前有5000多万家小微企业,假定50%企业需要一万元以上的贷款,这个市场理论上的容量就有2500亿元。但是服务于这些小微企业,传统的信贷手段成本比较高。此时,阿里金融所拥有的企业经营数据库就显得非常重要了。除了阿里金融之外,马云的金融棋盘还有另一妙手——支付宝。成立八年以后,支付宝以48.6%的市场份额稳居第三方支付市场的首位。现在的支付宝已不仅是淘宝棋局里的一颗棋子,而是成为独立的棋盘。2012年5月,支付宝获得基金第三方支付牌照,正式为基金公司和投资者提供基金第三方支付结算服务。目前包括博时、汇添富、华夏、天弘、金鹰、鹏华、华宝兴业在内的30家基金公司已与支付宝达成基金支付的接入合作意向。
本文关键词: 本文论坛网址:
您可能感兴趣的文章
本站推荐的文章
本文标题:
本文链接网址:
1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。十天内免登录
谢平互联网金融报告连载7:基于大数据的征信和网络贷款
  (本文为《互联网金融报告2014》第六章)
  第六章 基于大数据的征信和网络贷款
  6.1对大数据的讨论
  一、大数据的定义与类型
  大数据产生的背景是整个社会走向数字化,特别是社交网络和各种传感设备的发展。云计算和搜索引擎的发展,使得对大数据的高效分析成为可能,核心问题是如何在种类繁多、数量庞大的数据中快速获取有价值的信息。大数据在社会分析、科学发现和商业决策中的作用越来越大,金融只是其中的一个应用领域。
  大数据是一个新概念,英文中至少有三个名称:大数据(bigdata)、大尺度数据(bigscaledata)和大规模数据(massivedata),至今未形成统一定义。但一般认为大数据具有四个基本特征(即所谓4V特征):数据体量庞大(volume)、价值密度低(value)、来源广泛和特征多样(variety)、增长速度快(velocity)。
  从学术角度,对大数据的讨论基本属于数据科学(DataScience)和数据挖掘(DataMining)的范畴。
  根据大数据的表现形式与具体内容,可以将大数据分为如下三类:
  第一类是记录数据,即记录的汇集,其中每个记录包含固定的数据字段(或属性)。比如,计量经济学中的横截面数据、文档数据、事务数据或购物篮数据。记录数据通常存放在平展文件或关系数据库中,属于结构型数据的范畴;
  第二类是基于图形的数据,包括带有数据对象之间联系的数据和具有图形对象的数据,比如网页链接、化合物结构;
  第三类是有序数据,包括时序数据、序列数据、空间数据。比如,宏观经济指标序列,金融价格序列,基因组序列,词或字母的序列,同一时点上从不同的地理位置收集的气象数据(温度、湿度、气压等)。
  二、大数据分析的主要任务
  大数据分析主要有两类任务:第一类是预测任务,目标是根据某些属性的值,预测另外一些特定属性的值。被预测的属性一般称为目标变量或因变量,被用来做预测的属性称为解释变量和自变量;第二类是描述任务,目标是导出概括数据中潜在联系的模式,包括相关、趋势、聚类、轨迹和异常等。描述性任务通常是探查性的,常常需要后处理技术来验证和解释结果。这两类任务,又可以细分成七种:分类、回归、关联分析、聚类分析、推荐系统、异常检测、链接分析。
  (1)分类(classification)的目标是确定数据对象属于哪个预定义的目标类。典型例子是信用评级。
  (2)回归(regression)与分类非常接近,关键差异在于:在回归中,目标属性是连续的;在分类中,目标属性是离散的。可以简单理解为,分类是预测某事是否发生,回归则是预测某事以多大的概率发生。回归也是最常用的计量经济学分析方法。
  (3)关联分析(associationanalysis)主要针对购物篮数据,目标是发现隐藏在大型数据集中的有意义联系。关联分析的一个广为人知的例子是零售商发现许多购买尿布的顾客也购买啤酒,因此可以将尿布和啤酒摆在一起,以促进交叉销售。关联分析的目标是发现联系,而不是解释联系。
  (4)聚类分析(clusteranalysis)根据在数据中发现的描述对象及其关系的信息,将数据对象分组。目标是,组内对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。
  (5)推荐系统(recommendersystem)的目标是预测用户(user)对选项(item)的喜好。比如,在线报纸基于对用户兴趣的预测结果,为读者提供新闻报道;在线零售商基于顾客的购物和/或商品搜索历史,为顾客推荐他们可能想要买的商品。亚马逊的推荐系统最具代表性。
  (6)异常检测(anomalydetection)的目标是识别特征显著不同于其他数据的观测值。这样的观测值被称为异常点(anomaly)或离群点(outlier)。异常检测算法要发现真正的异常点,而避免错误地将正常对象标注为异常点。异常检测的应用包括检测欺诈(比如信用卡欺诈检测)、网络攻击、疾病的不寻常模式、生态系统扰动等。
  (7)链接分析。Google的PageRank算法是链接分析的代表。在PageRank出现前,搜索引擎领域有大量词项作弊(termspam)问题,一些人通过修改网页的方式(比如大量重复某一关键词)欺骗搜索引擎,让它们相信一个本来不相关的页面。PageRank算法针对词项作弊开发的,主要有两项创新:一是模拟互联网冲浪者的行为。这些假想的冲浪者从随机网页出发,每次从当前页面随机选择出链前行,该过程可以迭代多步。最终,这些冲浪者会在页面上汇合。较多冲浪者访问的页面的重要性被认为高于那些较少冲浪者访问的页面。网页的这种重要性就用PageRank值来衡量;二是在判断网页内容时,不仅考虑网页上出现的词项,还考虑指向该网页的链接中或周围所使用的词项。
  三、大数据分析与计量分析的差异
  (一)处理的数据类型不同
  计量经济学处理结构型数据,主要包括横截面数据、时间序列数据和面板数据,一般能以excel表格的形式呈现,而且表格的行列都有清晰的经济学含义,有一致统计口径。这些数据都可以转化为数据矩阵,计量经济学的很多基本概念、分析工具和算法都可以用矩阵或矩阵运算来表述。
  大数据分析能处理很多非结构型数据,包括文档、视频、图像,一般难以用excel表格的形式呈现。但这些非结构型数据需要量化后才能分析,在量化中一般伴随着信息损失。比如,在大数据分析中,文档要表述成词向量的形式才能做进一步处理,而词向量只体现了哪些词在文档中出现、出现了多少次等信息,词的排列中的语义信息则很难被提炼处理。
  (二)分析重点不同
  计量经济学分析的重点是假设检验,核心理念与波普的证伪主义非常接近。在一般的计量经济学分析中,首先要明确若干待检验假说,这些假说多由经济理论推演而来。其次,要构建零假设(nullhypothesis)。零假设一般是希望被证伪的命题。比如,在相关性检验中取&两者之间没有关联&作为零假设,而在独立性检验中取&两者之间有关联&作为零假设。在零假设成立时,样本数据或由样本数据构建的检验统计量应服从某种已知的概率分布。如果样本数据或检验统计量的实际值,在该概率分布下只能以很小几率(即置信水平,比如1%、5%)出现,就认为样本数据或由样本数据构建的检验统计量不符合零假设对应的概率分布,从而在一定置信水平下否定零假设。否则,不能拒绝零假设(但永远不能说&接受零假设&)。计量经济学就是通过假设检验,来证伪或支持(注意不是证实)某个经济理论。
  此外,参数估计也是计量经济学分析的重要内容之一,但针对参数的假设检验比参数的具体取值更为重要。计量经济学可以做预测,但预测主要属于政策研究范畴,一流学术研究主要是对经济理论进行检验。
  相比之下,大数据分析更具实用主义色彩。预测在大数据分析中占有很大比重。分类、回归被用来揭示变量之间的关系,根据这些关系以及已知变量来预测某些未知变量;关联分析、聚类分析、推荐系统和异常检测则被用来探查数据中潜在的相关、趋势、聚类、轨迹和异常等模式,期望这些模式在其他场合或未来也成立,从而具有实用价值。因此,对预测效果的后评估也是大数据分析的重要内容。
  但是,大数据分析与计量经济学的内在联系也不容忽视。在对随机问题的处理上,它们没有本质差别,基础理论都是概率论和数理统计。更细致的分析表明,大数据分析中的最近邻分类器,与计量经济学中的线性回归,在本质上没有差别;大数据分析中的异常检测,与计量经济学中的最大似然法,相当于从不同角度看同一个问题。
  6.2大数据在金融领域的应用
  数据是金融机构的核心资产。通过对金融中介的分析,我们可以看到,处理信息不对称和规模效益是金融机构的两大特点。而这两大特点都要求金融机构拥有大规模、高质量的数据。大数据改变了传统数据及其分析方法,对金融领域产生了重要的、甚至革命性的影响。这主要体现在大数据给传统金融中介提供了新的分析工具,使得传统金融机构能够利用大数据丰富客户资源、开拓新的市场、并提升内部管理和运营水平。
  传统金融机构数据类型主要以记录类型为主,包括客户基本信息、财务信息、与金融机构交易往来信息等。大数据大大拓宽了金融机构可用数据的种类。在大数据条件下,金融机构可以采集并应用图片、视频、社交网络信息等非结构化数据。比如交通银行信用卡中心应用智能语音云产品对海量语音信息进行处理,从语音数据中提出丰富的客户信息,包括客户身份信息、客户偏好信息、服务质量信息、市场动态信息、竞争对手信息等。每天处理数据量达到5000小时、20GB,使得历史语音检索花费时间从3-5天缩短为5分钟,极大的加快了处理能力。
  大数据使得金融机构产品营销具有更好的精准性。通过大数据分析,使得原本因果关系不清晰的几个事务关联起来。比如,中信信用卡中心利用大数据发现周末18:00之前加油的客户有相当比例去中心城区吃饭,因此信用卡中心与城区的烤肉店进行合作,由银行向加油站客户投放广告,促进信用卡消费。
  大数据同时创造了新的金融业务模式。比如说应用大数据理念的京东模式。2012年,京东通过与中国银行合作,推出&供应链金融服务&,供应商可以凭借其在京东的订单、入库单等向京东提出融资申请,由京东经过大数据分析、核准后递交银行,再由给予放款。据报道,此服务可以帮助京东供应商大幅度缩短账期,资金回报率由原来的60%左右提高到226%。
  目前,大数据还在金融机构舆情分析、360度客户全景视图、运营日志分析、客户欺诈和风险监控中得到广泛的应用。
  二、大数据在证券投资中的应用
  主流的证券投资理论认为,市场基准指数是投资的出发点,是默认的资产配置方案,也就是在一定程度上承认市场有效;投资者仅在有不同于市场平均的观点或预测时,才可以偏离市场基准指数进行投资(即主动投资,activeinvestment),但必须权衡自己观点或预测的可靠性。
  主动投资的一般可以归纳为5步:(1)从数据中提炼有价值的信号;(2)基于信号形成不同于市场平均的预测;(3)根据预测制定策略;(4)根据策略实际效果或回溯测试(backtest,即用历史数据测试策略效果),评估策略业绩;(5)根据业绩评估结果,评价信号是否有价值以及预测是否有效,并进行修正。大数据分析主要在第1步和第2步使用。这两步往往配合进行,不能截然分开。从数据中提炼信号,可以依据经济理论,也可以使用数据挖掘方法。原则是,信号应该有助于改进对证券价格的预测,否则就是噪声了。我们结合美国加州大学河滨分校VagelisHristidis及合作者关于Twitter与股票价格的论文来说明大数据分析在证券投资者中的应用:
  首先,他们分析了Twitter上与某只股票有关的全部信息,设计了几个用来衡量Twitter活跃度的定量指标,发现部分指标与未来1到3天的股票交易量、收益率之间存在比较显著的相关关系。此即第1步&&从数据中提炼信号;
  其次,他们根据前面设计的Twitter活跃度指标,建立了关于股票收益率的预测模型。此即第2步&&基于信号形成预测;
  接着,他们根据前述模型的预测,投资于预测收益率最高的几只股票。此即第3步&&根据预测制定策略;
  最后,用回溯测试法,比较基于Twitter的投资策略与其他策略的业绩,发现基于Twitter的投资策略的业绩最好,说明Twitter信息可以用于证券投资。此即第4步和第5步&&业绩评估、反馈与修正。
  三、大数据在保险精算中的应用
  从目前文献看,非寿险精算中出现了大数据应用案例,代表者是基于使用的保险(usage-basedinsurance),一种根据汽车使用情况厘定费率的车险。这种车险要求汽车配备GPS、测速器和无线电装置。保险公司掌握车型、开车时间(比如是否在交通高峰期)、行驶里程(比如是否长期开车不休息)、行驶地点(比如是否在容易出事故的地点)、驾驶习惯(比如开车时是否打电话)等信息,这些都会成为厘定费率的依据,也便利理赔。
  在寿险精算方面,大数据应用还不多。尽管基因、家族遗传、生活习惯、职业等对一个人的寿命有显著影响,气候变化、环境污染等自然条件也会影响人的寿命,但这些因素还难以纳入生命表的分析框架中。
  基于大数据的征信与网络贷款目前发展得较为成熟,下面将重点介绍大数据在征信和网络贷款中的应用。
  6.3基于大数据的征信
  一、征信的本质是客户分类
  征信主要是根据客户的财务状况、行为特征、行业环境、信用记录等信息对客户的贷款能力、还款意愿进行评估。征信本质上是一个分类问题,是根据违约可能性高低,将企业和个人分类,数学上可以抽象为如下过程:用X表示企业和个人的特征、属性和历史信息等(即自变量),用Y表示信用评级、违约概率、信用评分等指标(即因变量),征信本质上是在实证分析基础上,用关于X的函数g(X)作为对Y的预测。在设定和校准预测函数方面,银行业进行了大量探索,集中体现为BaselⅡ&Ⅲ的内部评级法。
  相对传统征信而言,基于大数据的征信主要是引入新的数据来源,但在信用评估的具体方法和模型技术上变化不大。直观理解是,传统征信是用自变量X来预测因变量Y,基于大数据的征信则是用新自变量Z和X一起来预测Y,但在设定和校准预测函数上两者没有本质差异。
  二、征信的数据来源
  由于互联网企业在开发核心业务的过程中,逐渐产生了传统银行所不具备的客户行为数据,而这些数据一定程度上更能反映客户的社会关系和经济行为特征,更能反映客户的贷款需求和信用状况。这与官方大数据库相比,两者具有明显的互补特征。我们通过对中国官方的征信大数据和互联网大数据的比较进行说明。
  (一)现有的征信大数据主要来源于银行,主要是对已有贷款客户的信用记录。比如中国人民银行征信中心的大数据主要来源于如下:金融机构采集的客户贷款信用交易信息和对信用主体有直接、明确影响的非信用交易信息,而且以金融行业的信贷数据为主、非信用交易信息为辅,具体包括五类:
  一是银监会批设的授信机构所产生的信贷信息。这部分是征信中心的主要数据源,已由行政法规保障征信中心对相关数据的强制性采集权。授信类金融机构的信息化程度一般较高,数据库中的数据质量较好。例如商业银行的客户信用信息。
  二是非银监会批设的授信机构所产生的信贷信息。这类数据是补充数据来源,同样由行政法规来确保征信中心的数据采集权。这类机构的规模较小,而且信息化程度参差不齐,因此,数据的质量也参差不齐。例如小额贷款公司、小额担保公司、典当行的客户信用信息。
  三是公用事业单位所提供的具备信用特征的相关数据,例如社会公众的电信缴费记录数据。这类数据一般以许可或协商方式采集,数据的质量受到公用事业单位信息化水平的影响。
  四是政府部门在行政执法过程中所产生的信用及合法行为类信息。这类数据对信用主体的信用报告具有重要影响。随着政府行政信息的逐步公开,这类信息可从公开渠道查询采集。
  五是法院在案件审理过程中所产生的立案、诉讼、判决、执行等信息。这类信息对信用主体的信用报告也有重要影响。除特殊情况外的司法信息将来会公开,也将逐渐可从公开渠道搜寻采集。
  (二)互联网金融企业的数据来源于核心业务,主要是初始的核心业务,但也有一些公司通过客户授权的关联账户取得数据信息。例如,百度主要拥有两种具有优势的大数据:以用户搜索为基础表现出的客户需求数据;以爬虫和阿拉丁为基础获取的公共网络数据。而阿里巴巴主要拥有电商交易数据和客户评价的信用数据。在当前的数据挖掘能力水平上,这两种数据更容易分析出商业价值。除此之外,阿里巴巴还通过投资微博和高德掌握了部分社会公众的社交数据。腾讯则拥有用户关系数据以及由此产生的社交网络数据,这些数据可以用于分析客户的生活行为,并从中挖掘出社会、政治、商业、文化、健康等领域的信息,甚至用于预测客户或市场的未来趋势。网络贷款公司Kabbage自身并不积累客户的历史交易数据,主要依赖从第三方获取数据。这些数据的共享或读取主要通过取得关联账户的授权来实现。数据必须是可标准化、时间序列化的,可以通过互联网直接传送。Kabbage的主要数据来源见表6-2。
  三、征信的数据分析
  (一)分析框架数据处理是征信中心对客户的相关信用信息进行筛选、分类、加工。征信中心的数据处理框架可以初步概括为6个部分,分别为数据提供层、数据交换层、基础数据层、数据处理层、产品加工层和数据迁移。数据提供层:通过队列、文件、数据库等方式从应用系统中抽取数据。数据交换层:对数据进行格式和逻辑上的校验,并加载到基础库中。基础数据层:保存校验后的数据,作为贴源数据层,为数据和产品加工提供数据源。数据处理层:(1)主数据管理,对信用主体进行识别和整合;(2)共用信息库,对交易数据进行粗加工,供数据集市使用。产品加工层:进行产品加工,包括基础产品和增值产品。数据迁移:包括调度、数据交换和格式转换等。
  征信中心对数据进行校验、清洗、匹配、存储和管理后,根据产品设计与研发成果,将数据加工成对应产品。征信中心定位为&金融信用信息基础数据库&,主要服务对象是授信机构,同时也为信用主体和政府机关提供相关服务。根据客户规模和需求的不同,征信中心目前规划了5类产品:数据类产品、工具类产品、解决方案类产品、外包服务类产品、信用主体服务类产品。
  数据分析在阿里金融的业务决策中处于核心位置,目标是向公司管理层提供科学、客观的分析结果及建议,并对业务流程提出优化改进方案。具体而言,数据分析主要为微贷、理财、保险和消费等方面的业务决策提供服务,从而为公司的市场营销、信贷审批、授信、支用、监控、催收等各项工作提供支持。
  (二)分析方法
  信用评估有定性和定量两类方法,基于大数据的征信必须兼顾两种方法。定性方法的代表是5C评估,主要是根据专家判断,从品德(character)、能力(capacity)、资本(capital)、条件(condition)、抵押担保(collateral)等5个维度评估信用。随着统计方法和技术手段的完善,定量方法起的作用越来越大。在大数据征信评估中,比较经典的方法是Merton模型、CDS模型、Logit模型和贝叶斯判别法。其中,Logit模型和贝叶斯判别法对企业和个人的信用评估都适用,根据企业和个人的特征、属性和历史信息等预测信用状况。Merton模型、CDS模型则只分别适用于有股票、CDS交易的企业,从股价、CDS价差等市场信息中推导出信用状况,隐含前提是市场能反映信用信息。此外,Merton模型是从因果关系角度看待信用风险,称为结构化模型(structuralmodel);其他三个模型则是从相关关系角度对信用风险进行预测,称为简约化模型(reducedformmodel)。
  各种方法的基本思想是:Merton模型的思想最早由著名经济学家RobertMerton阐发(相关论文后获诺贝尔经济学奖)。Merton模型将企业股票看成以企业资产为标的、以企业债务为行权价的看涨期权,先从股价中推导出企业资产的市场价值和波动率,再计算资不低债(也就是违约,这里面体现了因果关系)的概率。穆迪公司的KMV模型将Merton模型商业化。CDS本质上相当于对一个或多个机构(称为标的机构)债务的信用风险的保险。一笔CDS交易中有两个参与者,一方为保护权买方,另一方为保护权卖方。保护权买方定期向保护权卖方支付固定费用(称为CDS价差)。作为对价,如果CDS到期前,标的机构发生了拒付或重组债务等事件(称为信用事件),保护权卖方有义务赔偿保护权买方的损失。CDS的市场交易非常活跃,相关市场信息比较透明。
  Logit模型形式简洁,拟合方便,是银行业在企业、个人信用评估方面最常用的模型之一。Logit模型属于非线性概率模型,其推导基于隐性变量模型(latentvariablemodel)。贝叶斯统计的思想是,假定对研究的对象已经有一定认识,用先验概率分布来描述这种认识,然后取得样本信息数据,用样本数据来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。将贝叶斯思想用于征信判别分析,就得到贝叶斯判别下的征信评估结果。
  目前,国内的互联网征信环境正在逐步完善中,P2P、小贷、电商平台都有部分接入银行或者央行征信系统的需求。这是因为,大多数互联网平台没有阿里金融那样大规模的数据,也缺乏持久的数据积累。即使是阿里金融,也发现央行征信数据对其业务发展的不可或缺性。需要明确的是,互联网金融的优势在于数据分析和征信,渠道是外在的表现,内在的核心是数据和信用。
  四、典型案例:ZestFinance
  ZestFinance是一家信用评估公司,于2008年在美国洛杉矶创立,创始人为谷歌公司前首席信息官(CIO)DouglasMerrill和CapitalOne公司前主管ShawnBudde。ZestFinance主要特点如下:
  一是拓展数据运用维度。在数据来源上,ZestFinance公司强调一切数据皆为有用数据,通过对多达七万个的潜在信用信息进行收集和分析,更好地评估还款意愿和能力、违约风险及维持长期客户关系可能性等。除了传统信息收集渠道,ZestFinance还搜集客户在网络社交媒体中的点击、翻页、关注、评论、分享等行为数据;通过经常使用的网络IP地址,将客户来自哪里、使用什么电脑、是否玩游戏作为潜在的可用数据;通过申请人申请贷款时在贷款网页上停留的时间等信息作为判断其教育背景、还款能力与还款意愿的有用信息。
  二是创新数据处理方式。ZestFinance最新的模型是取自统计学家DavidHilbert之名的Hilbert。模型分析包括特征变换、特征提取、独立模型建立和合成模型等步骤,数以千计的变量中有75%可通过机器学习自动处理,其余25%的变量则采取人工处理的方式。
  6.4基于大数据征信的网络贷款
  一、网络贷款与传统贷款的异同
  网络贷款最核心的内容仍然是信用。基于大数据的网络贷款,其核心工作与传统贷款并无太大的区别,其流程如下:针对客户群体收集建立数据库、并在一定的技术方法下研究出客户行为数据与客户信用之间的内在联系、给出客户违约的预期概率和违约预期损失。
  同传统贷款业务一样,征信是网络贷款的首要问题。但网络贷款的操作模式、数据内容、渠道方式较传统贷款存在明显的差别:一是操作模式。大数据网络贷款的操作主要通过网上申请。这种转变减少了纸质贷款申请填写、递交、审核、内部流转、风险评估等等环节,提高了贷款效率、降低了贷款交易费用;二是数据来源。大数据网络贷款对客户评估的数据,主要来源于客户属性、网上交易记录、网上信用评价、网上交易习惯、社交网络信息,以及财务信息。传统的贷款对客户评估的数据,主要来源于客户财务报表和担保抵押。前者数据更有利于反映客户真实的经济状况和未来的收入趋势,更能反映客户的信贷风险;三是风险控制。大数据网络贷款依靠贷后实时监控、系统自动扣款、鼓励提前还款控制信贷风险,通过网络实时监测客户信贷资金运用和风险状况,并且通过系统自动扣款保障还款的及时性。在传统的贷款中,银行很难实时掌握客户经营状况和资金流信息,也很难实现主动扣款,除非客户向指定账户存入足额资金。因此,大数据的网络贷款具备了传统银行贷款所不具备的许多优势。
  二、网络贷款的流程
  网络贷款公司在对大数据进行挖掘、总结客户信用等级规律的基础上,根据客户提出的贷款申请信息,通过计算机系统评估出客户违约风险,确定信用额度、贷款利率和贷款期限,同时给出偿还方式和违约罚则。其过程,可以归纳为贷款申请、审批发放、贷后管理。下面以阿里小贷和Kabbage为例来介绍网络贷款的流程。
  (一)贷款申请
  准备申请贷款的客户,首先登录网络贷款公司网页,在线提交贷款申请表。不同贷款公司要求填写的申请表信息可能有所差别,但主要内容相差不大。阿里小贷要求的信息主要包括申请额度、公司名称、法定代表人姓名、法定代表人手机号、法定代表人信箱、法定代表人婚姻状况。
  阿里小贷接收到贷款申请后,调查团队调阅客户在阿里巴巴B2B、淘宝网C2C、天猫B2C等平台上的交易记录、信用记录、同业比较、库存变动、财务信息、非财务评价、征信报告、银行对账单等信息,并进行实地走访。实地走访工作包括:首先,阿里小贷授权并委托第三方专业机构派出外访专员直接上门拜访申请贷款的企业,当面了解企业经营情况,现场征信并拍照收集主要的申请资料;然后,阿里小贷的客户经理与客户电话沟通确认。
  值得一提的是,阿里小贷通过水文交易预测模型,对客户进行主动营销。主要原理是,利用水文变量预测淘宝未来交易金额(能有效剔除季节性波动影响),判断客户资金规模和偿还贷款的能力,对处于用款高峰的客户进行最大力度营销,对即将达到用款高峰的客户进行提前式低强度营销。所有营销动作和反馈结果都记录在案,并在后期通过响应模型予以优化。
  (二)审批发放
  贷款公司根据前期掌握的客户资料和大数据挖掘的规律,在一定的系统模型内进行计算评估,并结合人工审查,决定是否对客户进行放款,并确定放款的条件。例如,阿里小贷接收到客户在线申请后,使用违约风险PD模型对网商进行信用评分。该模型分三个步骤(图6-9):第一步,归集现有客户的个人信息、征信信息、历史表现、交易信息和经营状况等信息;第二步,根据归集的信息,筛选出对信用状况有显著影响的变量,建立PD模型;第三步,根据PD评分对潜在客户分类,区分出信用好和不好的客户。通过该模型,网商在阿里巴巴生态系统中的信用、交易、投诉纠纷等百余项信息得到了充分运用,最终作为贷款评审依据,解决了传统银行在对中小企业(和个人)贷款时存在的信息不对称、流程复杂等问题。
  阿里小贷根据网商信用评分和商城融资担保情况,决定给网商的贷款额度、利率和期限等。如果贷款获批,客户需要和阿里小贷签署合同,绑定法人(或个人)银行卡和支付宝账户。阿里小贷实行个人实名认证和支付宝认证,以确认支付宝贷款到账金额。在阿里小贷中,交易平台和融资平台实现了高度统一,两者之间信息高度互通,放贷者不必花费巨大成本作为交易局外人去获取信息,而是作为交易亲历者在第一线和第一时间发现融资机会、提供融资,使金融资源配置的效率大为提升。
  再如,Kabbage的口号是&7分钟内拿到成长所需资金&。网商提交注册数据后,Kabbage后台系统自动审核该网商是否拥有足够长时间的网络销售数据。网商通过审核后才有资格提交贷款申请,之后一切审核程序都由Kabbage后台系统自动完成。Kabbage依据信用评估结果决定是否授信,以及授信金额、利率和期限。Kabbage的算法可以保证在7分钟内输出结果,并将资金打到申请人指定的第三方网络支付账户。Kabbage的放贷是高度定制化的,可以针对每一个申请人的需求提出个性化方案,比如根据申请人的经营情况、贷款目的自动调整贷款额度、期限和利率。
  Kabbage拥有网上拍卖、交易场所环境下提供流动性贷款等几项专利。网商可以根据未卖出但已上架待售的商品向Kabbage申请贷款,在商品卖出收到货款后再偿还贷款。在这个过程中,Kabbage从订单贷款中收取利息或费用,网商则可以提前获得现金流,以维持营运资本。Kabbage提供的信用贷款金额在500美元到4万美元之间。贷款利率由贷款期限(最长6个月)和网商信用状况共同决定,一般为2%-7%(30天)和10%-18%(6个月)。
  (三)贷后管理
  网络贷款公司为了监督贷款使用情况、实时掌握客户经营状况和违约的可能性,分别制定了贷后管理措施,以减少还款风险。
  例如阿里小贷公司,根据网商的交易信息和财务报表信息,利用监控评分模型、贷后催收评分模型,监控贷款用途和运作效率,及时收回贷款。在还款上,阿里小贷采用分期等额本息偿还法。客户定期将还款资金通过银行卡转入支付宝账户,或者在支付宝账户留有足够金额,由支付宝系统自动扣款。如果客户提前还款,阿里小贷一般会收取本金的3%作为手续费。如果出现逾期,逾期期间按正常利率的1.5倍计息。
  再如Kabbage公司,它的还款安排非常简单。在每月约定的还款日,Kabbage从网商的支付账户中扣除固定的还款金额(加上若干处理费用)。网商可以选择提前还款,并且提前还款不会产生任何额外成本。
  Kabbage贷后监控的核心是,通过多重数据源交叉验证(尤其是支付账户的现金流向数据),了解网商的真实经营情况。Kabbage做到了对网商销售情况和资金流向的实时掌控,能在第一时间对现金流紧张的商户做出预警,提高关注级别。Kabbage如果确认某商户有支付困难,可以从该商户的支付账户转回部分现金,并采取不再予以授信的惩罚性措施。
  Kabbage对拖延还款设立了惩罚机制。在还款日,如果支付账户中没有达到规定的月度还款额,Kabbage通常会收取35美元作为延迟费用,同时保留向其他追贷机构报告的权利。如果商户从第一个还款日就开始错过还款,Kabbage会将该商户视作不诚信,并交由公司法务部门处理。Kabbage坏账率大约在1%,低于美国银行业5%-8%的平均水平。
  以Kabbage和阿里小贷为例,其贷款流程可以概括如下图
  三、典型案例的分析
  (一)Kabbage
  Kabbage是国际上网络贷款的典型。Kabbage创立于2008年,主要为不满足银行贷款条件的网上商户提供运营资金。在eBay、雅虎、亚马逊等电商平台上聚集了数目庞大的中小型网商,它们的资金需求具有周期短、金额小等特点,但因为FICO信用评分低于720分,也不愿意承担抵押个人资产的风险,所以难以从银行获得贷款。Kabbage针对这部分群体,分析与它们有关的网络数据,为其提供信用贷款。Kabbage的客户已超过10万户,年度信贷规模总量约2亿美元,单个客户平均每年拿到10笔贷款。
  (二)Kreditech
  Kreditech是一家应用大数据技术和机器学习算法,为新兴市场客户提供在线短期小额贷款的小额贷款公司。截止至2013年10月,Kreditech累计获得了贷款申请约25000笔,年均贷款增量约1400万欧元。Kreditech与传统贷款相比,具有一些典型特征,具体如下:
  一是通过大数据收集,实现自动调查。Kreditech通过对多达8000个数据点的客户信息进行在线自动收集,从而实现客户信息的多维度交叉验证;
  二是通过大数据分析及机器人算法优化,实现自动审查审批。通过对机器人学习算法进行最大化贷款的偿还率训练进行风险分析,独立开发了小微风险评分模型;
  三是通过流程优化,降低成本。Kreditech通过对信贷业务流程自动化、快捷化改造,满足资金需求大致在50到2500欧元之间的目标客户短、频、快的需求,实现了进一步的风险分散,降低了业务成本;
  四是通过产品创新,全面满足需求。Kreditech通过提供常见的发薪日贷款(paydayloan)、网上小额贷款(onlinemicroloan)和零售贷款(retailloan),以及相对大额贷款、预付信用卡和移动信用等新产品,对目标客户的融资需求进行了较为全面地覆盖;
  五是通过严格内控,实现隐私保护。Kreditech很重视对用户数据隐私的保护,获取数据需要用户同意或手工确认,并承诺不出售或传播客户信息,所收集来的信息将以匿名形式保存90天,之后将被删除。
  (三)阿里小贷
  阿里小贷是国内网络贷款的典型。阿里小贷最大的优势在于信息优势。阿里小贷与阿里巴巴、淘宝网、支付宝底层数据完全打通,通过大数据和云计算,客户网络行为、网络信用得以在小额贷款中得到运用。小企业在阿里巴巴和淘宝店主在淘宝网上的经营信用记录、交易发生的状况、投诉纠纷情况等百余项指标信息都在评估系统中经过计算分析,并最终作为是否放贷的评价标准。
  阿里小贷所有贷款流程都在网上完成,通过支付宝发放贷款,基本不涉及线下审核,最短放贷时间仅需3分钟。信誉较高的客户还可以通过申请和人工审核获得超额贷款,金额在1000万元以内。2013年,阿里小贷累计客户数超49万家,贷款余额超120亿元(成立以来累计放贷超过1000亿),户均贷款余额不到4万(户均授信约13万),不良贷款率在1%以内。在资金来源方面,自有资本20亿元左右,2013年完成资产转让约80亿元。
  6.5中国基于大数据征信及网络贷款存在的问题
  大数据支撑及推动了互联网金融的蓬勃发展,但这一领域也存在一定的问题,初步归纳如下:
  一、缺乏核心技术
  尽管信息技术迅速发展、网络交易数据成倍增加,但中国在研究设计大数据挖掘平台工具方面能力非常薄弱。从技术角度分析,大数据挖掘越来越依赖于Hadoop平台,这一平台也越来越影响到中国大数据分析技术的发展方向,中国在这一平台的构建方面如无突破性创新发展,将来必然受制于人。
  二、忽视基础数据库建设
  尽管国内许多企业或专家在宣扬大数据的作用,社会公众对大数据的关注程度也空前高涨,但对于如何发展大数据产业以及如何在互联网金融领域更大地发挥大数据的作用,仍未找到合适的方向。同时,人们在大肆宣扬大数据在非结构化数据分析方面的功能的同时,往往忽视了基础信息资源建设。
  三、大数据挖掘的变量选择仍有待精确
  数据挖掘的基本问题是数据的数量、质量和维数,选择准确的分析变量有利于提高数据挖掘的效率,数据模拟及预测的准确程度。国内现有的互联网金融资料表明,互联网金融大数据的变量选择仍有较大的提升空间。
  四、大数据分析模型与方法仍有待提高数据模型包括概念数据模型、逻辑数据模型、计量模型等。数据挖掘的模型也有多种,例如采集模型、处理模型及其他模型,但无论哪种模型都不同程度地存在缺陷。改进和完善现有模型、探索和建立新的模型,是大数据在互联网金融领域进一步发挥作用的前提。同时,大数据是海量的,在海量数据中挖掘数据之间的内在联系以及预测数据变化趋势,特别是对客户属性、交易记录、评价信息以及商品信息进行合理预测,至今都还没有统一的标准;同时,数据挖掘过程中出现的大量非标准化数据格式,也给数据高效挖掘带来了困难。
  五、数据挖掘涉及到信息的私有性与安全性
  首先,互联网金融面临的重要风险之一是操作风险,计算机网络系统的故障和中断、网络黑客攻击及内部操作人员失误等,都会造成客户隐私性数据泄漏的风险。其次,大数据挖掘涉及到大量客户的个人隐私数据,过度挖掘必然会影响到人们的日常生活。
  本文为近期博鳌论坛发布的《互联网金融报告2014:通往理性繁荣》连载之七。
  该报告课题主持人:谢平
  课题组成员:
  陈超、邹传伟、刘海二、石午光、刘利红、陆婷、苗文龙
  田薇、陈晓文、吴亮、柏亮、李耀东、潘瑾健
  计葵生、范如倩
  陈海、贺斌、宋功武、欧阳海燕、卢瑞
  谢平、邹传伟、刘海二互联网金融更完整的表述,见《互联网金融手册》一书。
延伸阅读reading
世界是平的,移动互联网令人们的网上行为以气态方式存在,客户来源将逐步从线下转向线上。
更新日期:
  零壹财经推出的互联网金融深度阅读产品,思想性与可读性并具。
更新日期:
  继去年发行的《中国P2P借贷服务行业白皮书2013》之后的又一力作。
更新日期:
  零壹财经、零壹数据合作完成,这是国内第一本众筹行业研究专著。
更新日期:
  全景式描述了中国P2P借贷服务业发展的基本现状,提出了行业所面临的核心问题。
更新日期:
  本书讲述了LendingCulb在美国的实践,被许多人视为P2P借贷行业启蒙书。
更新日期:
  比特币在中国最受争议的时候,《比特币》出版了。这是一本简明的思想说明书。
热门搜索:

我要回帖

更多关于 大数金融招聘 的文章

 

随机推荐