网上如何找到股民客户利用大数据找到客户

如何用大数据找到客户--百度百家
如何用大数据找到客户
分享到微信朋友圈
如何通过大数据找到客户并带来源源不断的收益?
Intetix Foundation(英明泰思基金会)由从事数据科学、非营利组织和公共政策研究的中国学者发起成立,致力于通过数据科学改善人类社会和自然环境。通过联络、动员中美最顶尖的数据科学家和社会科学家,以及分布在全球的志愿者,我们创造性地践行着我们的使命:为美好生活洞见数据价值。
原作者:1.Jeroen D’Haen & 2.Dirk Van den Poel &3.Dirk Thorleuchter
一般来说,新客户获得的过程对销售代表而言压力颇大。幸运的是,销售代表们可以运用一些模型来帮助自己选择”正确的” 潜在客户。在选择“正确”潜在客户的过程中有两样重要因素:潜在客户成为真正客户的可能性,以及其成为客户后带来的收益。本文主要讨论后者。本文对现存的文献贡献主要有两点:首先,给出了两种数据源——网络数据和可获取的商业数据的预测效果,其目的在于找出作为收益预测输入时具有更高精确度的一项,并且研究结合使用能否提高精确度;其次,研究了不同数据挖掘技术的预测效果。结果表明(bagged)决策树(模型)在现实生活中的精确度更高。使用网络数据优于商业数据,而二者的结合使用更优于其单独使用。尽管商业数据在统计意义上颇为重要,但其附加价值相当有限。
新客户的获得是循序渐进的过程,只有部分特定的潜在客户才会成为真正的客户。一般来说,这个过程对销售代表而言压力颇大。幸运的是,销售代表们可以运用一些模型来帮助自己选择”正确的”潜在客户。在选择“正确”潜在客户的过程中有两样重要因素:潜在客户成为真正客户的可能性,以及其成为客户后带来的收益。本文主要讨论后者。本文旨在设计出一个能够预测其能否带来收益的模型。然而,此收益模型的主要瓶颈在于缺乏高质量的数据。本文将介绍一个新的数据源,并且比较它和传统数据源的表现,此外,我们将不同的数据挖掘技术和不同的数据源进行组合比较,并给出哪种组合能有更高的精确度。
构造一个高质量的预测收益模型的先决条件是要能获得高质量的数据。大多数模型都依赖于从特定供应商购买的商业数据。而从网络获取的文本信息被作为较新的模型数据源用于研究,运用网络挖掘和文本挖掘技术能从现存的或潜在的客户的网站上收集这类信息(Thorleuchter, Van den Poel, & Prinzie, 2012)。然而文本信息很少用作企业分析的输入(Coussement & Van den Poel, 2009),因为网络数据包含难以分析的非结构化数据,而隐式索引技术能让数据更结构化且可被用于模型的输入(Thorleuchter et al., 2012)。
本文对现存的文献贡献主要有两点:首先,给出了两种数据源——网络数据和可获取的商业数据,的预测效果,其目的在于找出作为收益预测输入时具有更高精确度的一项,并且研究结合使用能否提高精确度。其次,研究了不同的挖掘技术的预测效果。因此所有的研究问题能阐述如下:技术与数据源的何种组合是最精确的。本文与Thorleuchter et al. (2012)给出的论文之间的差异也彰显了这两点主要贡献。本文研究并比较了不同数据源和数据挖掘技术而不仅限于简单地对网络数据运用逻辑回归方法。这样就有一个清晰的基准(即商业数据)与网络数据作比较。因此本文可被看作是将从通过数据挖掘技术从网上获得的文本数据作为收益模型输入的首次真正尝试,并且本文将详细描述观测到的结果。
本文余下部分:首先比较网络数据和可获得的商业数据,再深入研究不同的数据挖掘技术,而结果将在对于所用数据的简单介绍后给出,最后就是我们的结论,以及对于本文局限性的论述和对后继研究的建议。
2、网络数据与可获得的商业化数据的比较
现今大多公司构建了包含大量客户信息及购买行为信息的大容量数据库(Shaw, Subramaniam, Tan, & Welge, 2001),而数据挖掘技术则被用于提取出隐藏于这些数据库中的信息(Mitra, Pal, & Mitra, 2002)。然而,这种数据源并不适于辨识出有价值的潜在客户(Arndt & Gersten, 2001)。公司构建的数据库只能代表其内部信息,即只会包含该公司自己的客户的信息。
3、数据挖掘技术
决策树有几个特别的优点(Tirenni, Kaiser, & Herrmann, 2007)。决策树是非参数方法,其单调预测变换时不变的(即无需变量变换)。参数化方法在数据维度较高情况下结果较差(我们所用数据即高维数据)(Petersen,Molinaro, Sinisi, & van der Laan, 2007)。另外,决策树在异常值的影响下是粗略的,图一给出了一棵简单的树可视化描述。
装袋(Bagging)
表1展示了不同数据来源下的数据挖掘技术的全部结论。表1告诉我们数据装袋是效果最好的(有最佳的AUC)。同时,与商业数据相比,网络数据可以产出更好的结论,与数据来源结合起来则会更佳。但令人奇怪的一点是,当商业数据和网络数据结合在一起时,AUC却会比单独使用商业数据时更低。这可能是因为逻辑回归分析无法处理高维度,尤其当应用选择法时。最终,回归适合了理想模型。此外,在网络数据及数据结合的案例中,更先进的数据装袋技术优于回归分析,而在商业数据模型中,预测性能方面没有什么不同。因此,可能是网络数据比商业数据包含更多的噪音干扰,且在自然中是非线性的。进一步的分析会展示这些结果是否是统计上显著的。
无论使用哪种类型的数据,决策树的AUC都为0.5。因为因为决策树修剪后,只有根节点仍保持。结果,决策树只给出一个不变的价值作为预测。在表2中我们可以看到,与决策树相比,回归和装袋树(同最高的AUC一起测验)有明显更高的准确性。装袋树和回归没有显著不同。图2中回归线和装袋树相交,也对这一点做出了阐述。
图2 ROC曲线-商业数据
至于网络数据,比起回归和一般决策树(表3)来,明显是装袋具有更高的准确性。图3显示装袋树与其他任何数据挖掘技术都没有相交。回归比决策树表现更好,但准确性仍较低(AUC=0.56,表1)。
图3 ROC曲线-网络数据
下一步就是将数据来源结合起来(网络+商业上可获得的外部数据),看看不同的数据挖掘技术的预测表现是什么。回归又一次比决策树效果更好(表4),尽管AUC仍较低(AUC=0.56,表1)。
此外,当结合两种数据来源时,回归效果比单独使用商业数据时更差(表1)。装袋树有最高的AUC,效果比回归和一般决策树更好(表4)。图4也清晰展现了这一点。
图4 ROC曲线-两种数据结合
最后一步是针对每个数据来源(在本例中是装袋树)比较出最佳的数据挖掘技术,并找出哪种数据类型会得出最佳结果。网络数据比商业数据结果好,但结合两种数据会提升预测表现(表5)。图5以图片形式生动展现了这一点。当装袋决策树时,也可能会得到重要变量的一个测量值。前十名的重要变量中绝大多数是网络数据变量,但其中的两个是来自商业数据集的。贷款和资本分别是重要变量的第四位和第九位,它们是预测公司盈利能力的两个重要指标。
图5 ROC曲线-最佳数据挖掘技术
6、结论与讨论
本文的目的是研究在预测客户盈利能力时,使用哪种数据来源并应用哪种数据挖掘方法更为有效。所研究的方法有逻辑回归、决策树和装袋决策树。所使用的两种数据类型为:来源于网络挖掘的数据和购买自专业卖主的数据。网络数据免费且人人都可通过互联网途径获得。不考虑数据来源的话,装袋决策树提供了最高的AUC(除商业数据外——在商业数据中,回归的表现同样好)。与商业数据相比,网络数据有更高的预测表现,但将两类数据结合的话,则会得到最好的结果。这对管理具有启示。在建立模型时,装袋决策树应该比逻辑回归和一般决策树更受欢迎。而且,网络数据是该模型理想的起点输入。如果预算允许购买外部数据的话,还可以将其与网络数据结合去提高模型未来的预测表现。不过,需要做一个成本效益分析,看看付出高额的数据购买费用是不是合理,因为预测表现的增长往往会比较小(相对而言)。
7、局限与进一步研究
本文所使用的定义是作为变量的,每年都不同。此外,数据集既要包括公司的老客户也要包括新客户。进一步的研究在定义变量时应该覆盖这段时间的部分。第二个局限是,由于使用了特殊的修剪法,决策树的AUC总是0.5。但是,我们确信,就算使用了不同的修剪方法,单一的决策树也不会给出令人惊喜的结果。正如第一部分中的解释一样,在客户获得的过程中,两个因素起作用:潜在客户成为真正客户的可能性,以及其成为客户后的盈利能力。本文使用数据来源与数据挖掘技术结合的研究方法,关注于客户盈利能力的预测。进一步的研究应当关注是否应当在客户获得模型中使用网络数据,这已超出了本文的研究范围。
参与人员:策划-徐睿艺、樊茜茜;编译-陈圣聪、郭烨;编辑-裴懿萱;
推广-申洪浩、程杰超、周宇琪、李华芳
转载声明:欢迎转载,请您在转载时保留署名和引用信息。
欢迎您在知乎或微信上关注我们。
附图完整版本请查阅:&&
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:7566
热门文章HOT NEWS
本文是分享给公号小白的初稿,玩号的水很深,并不像人们认为的“人...
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻一、CRM客户关系管理的客户培养 源于二八定率:20%的客户%带来80的利润。根据淘宝与各大卖家,评估统计一个新客户的成本占老客户的成本大概的成本3-10倍。销售产品的成功率有所不同:新客户的产品成功率大概是15%老客户50%。每年客户保有率增加5%利润增加25%-85%。二、客户细分另一重要原则RFM& & 让你决策更容易,让执行更高效,让客户更满意;怎么去理解RFM?在众多的电商CRM的分析模式,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。接下来,我来分享下RFM的细分纬度,让大家更清楚的了解RFM。三、RFM分别详解:& & & &R=一段时间里的一个期间以一年为客户生命周期来看把客户分为四个阶段。四个阶段的基础分法(只能参考实际需要根据自己的产品店铺的情况而细分)。F=一段时间里面的购买次数M=一段时间里的购买金额四、某化妆品类RFM分法&& & & R:4个阶段。根据客户R值分组根据客户F值分组根据客户M值分组活跃客户R&30新客户F=1低贡献客户M&00沉默客户30≤R&90回头客F=2中低贡献客户100≤M&200长期沉默客户90≤R&180成熟客户F=3中等贡献客户200≤M&500睡眠客户180≤R&270黏性客户F=4中高贡献客户500≤M&2000深度睡眠客户270≤R&360粉丝客户F=5高贡献客户2000≤M预留失客户360≤R&540忠诚客户F&5流失客户540≤R&720死亡客户720≤R1.活跃客户最近30天的客户(在一个月内她刚刚购买了护肤品比较有感觉的时候做二次营销新品推荐非常好)2.沉默、睡眠客户客户(活动通知比较好)3.预流量客户客户(更大的活动刺激他效果会更好)4.流失客户12月以上的客户(客户通知确认原因) F:3个分法。 ①一个月来购买一次月的顾客(每次上新他都会来参观或参与一下)②一个季节来购买一次的顾客(春夏秋冬每季都会来购买) ③半年来购买一次的顾客M:根据购买金额(贡献度)分级。五、CRM上的差异化服务四个方向如何做? 1.客服方面的差异:& & & & &一对一的客服咨询包括退换货期限的不同& &   2.物流方面的差异:& & & & &对高质量高忠诚度客户提供包邮服务或者包顺风的服务& & & & 3.在优惠力度方面:& & & & &上新优惠,老客户优惠,节假日优惠等& & & & 4.关怀& & & & &短信关怀,生日的慰问节日的祝贺天气变化的关怀问侯。六、如何进行客户细分? 首先根据RFM进行分层以后给予客户细分,然后在给不同的顾客,贴上不同的标签。 1.新品标签=上新是店铺非常需要的环节,这些顾客对价格不敏感对款式比较敏感(标签:新款顾客标签) 2.购买凭次=1个星期、1个月根据时间去贴标签 3.聚划算=对价格比较敏感的顾客(标签:聚划算顾客)七、活动顾客+单价比较高的顾客=贴店铺高端标签 会员等级符合高端条件的从会员里挑出那样适合高价的客单客户去营销售。关于客户的自然属性:这个是个细新的工作。买家特有的一些信息,比如:年龄、性别、生日、居住地、身高、体重、三围、联系方式等。此外还要有:生日(这个买家属于什么星座,大概可以知道买家性格特征)、居住地(可以推测买家的职业)、偏好(喜欢品牌品类风格)。&&&& 数据分析方面:帮助我们理解客户的特征(他们购买的金额凭次客户来源是那里比如:聚划算就是对价格比较敏感的这样可以更好帮助我们给客户打标签)。八、留住客户,二次营销 从R的角度去保有顾客:30天活跃的顾客进行新品通知,二次营销是比较好的,因为他现在对品牌的的认知是非常好的。睡眠期180天之内活动形式通知顾客。不同的生命期,进行不同的通知,新品的通知活动的通知更大活动的通知(活动是分每3个月3个月的开展,这样的情况1年可以通知4次,客户的流失率很低)。&&&&&& 活动+新品保有客户:关怀方面的营销(生日慰问,节日主课,天气变化,产品关怀);互动方面的营销(QQ群,旺旺群,掌柜说,微博)。 &&&&& 微博营销思路:前期吸纳粉丝,维护粉丝利用微博红人转发买家秀。九、减少客户流失 为目标客户创造优势产品、服务、和体验。提高顾客忠诚度、减少价值客户流失、最大化利润。潜在客户:对市场人群定位和细分,从战略上把握方向,更好的定位潜在客户首次购买客户:对目标市场人群的产品线细分,从策略上把握人群的消费能力,提高潜在客户转化。二次购买客户:对于存量客户沿着生命周期和RFM做客户细分,明确各个人群的重点和突破口,提高满意度和购买频次。十、建立客户忠诚度、减少客户流失 重复购买的顾客:将重复购买的顾客转变成为特别关照和了解的客户& &  合伙人分销:继续转变,拥戴型客户会极力称赞公司及其产品和服务,并会鼓励其他人购买。& &客户细分,没有最细,只有更细。精准的营销的魅力就是如何更精准精细的去找到顾客,了解顾客的需求开发更好的产品满足客户的需求。&十一、&客户培养的常用营销手段 1)下单体验:客服沟通体验、下单短信、下单邮件;2)发货体验:线下包裹体验、发货短信体验、线上查件体验;3)催付:旺旺催付、短信催付、邮件催付、电话催付;4)问卷:客户满意度问卷;5)其他:微博、帮派、旺旺群交流互动等。十二、 客户保持的常用营销手段 1)会员期刊:可以每月一期,弱化销售,重点体现出会员增值服务; 2)会员专区:产品类,通过邮件和短信的方式邀请客户参加; 3)上新邮件:每周上新前发送给买家,提前预告本周新品;4)活动短信:将一些客户感兴趣的活动推送给客户(需做好客户细分);5其他:生日祝福、节庆祝福等情感类的。十三、预流失客户挽回的常用营销手段 1)友情提醒:对45、60、90天未来的客户进行短信或者邮件提醒; 2)优惠卷:根据不同客户、不同天数给与不等的优惠卷; 3)上新邮件:通过产品的方式来刺激客户; 4)问卷:可以在60天的时候推送一份购物体验的问卷; 5)其他:专场促销、祝福等。十四、流失挽回的常用手段 1)大促提醒:通过大促的力度来激活流失客户; 2)友情提醒:90、120、360天进行一次关怀提醒; 3)优惠卷:赠送额度较大的优惠卷甚至红包刺激客户;4)专场促销:建立针对这个人群的专场促销活动;5)其他:生日、节庆祝福等。十五、如何催付款?& & & &我们需要对客户区别对待。方法如下: 新客户:&&&&&& 1、旺旺催付(旺旺留言买家,一般在买家下订单后2小时);& &  2、邮件催付(通过邮件形式发送给买家提醒买家付款,一般在买家下订单后第二天上午);& &  3、短信催付(通过手机短信形式发送给买家,一般在买家下订单后第二天下午)。 老顾客:1、短信催付(老顾客,既然来买了,一般都会付款,不要催的太急,用短信催付,一般在第二天下午发送)2、电话催付(主要针对单笔订单量比较大的买家,这个时候电话联系买家核实下具体情况,能更好的促进销售,一般也是在第二天下午进行电话沟通)。十六、电商CRM的总结&&&&&& 更加了解自己的消费者;不盲目,管理更有针对性,更有效;产品选择更加精准,UE更有调性;营销策划更加思路明确;较之前大大提高了客户体验。同事新手也面临人员数量不足,经验不足,真正起步较困难;一直处于探索的过程,消磨太多时间和精力。
CRM运营白皮书
行业领先 独家发行
网聚宝学院114网址导航

我要回帖

更多关于 网上如何找到股民客户 的文章

 

随机推荐