数据猿小猿 大数据据是传销吗

大数据揭秘网络诈骗“坑”人大招 周一周五骗子最活跃
【数据猿导读】
网络骗子们最喜欢什么时候活动?到底是男性还是女性更容易上当?哪个省份的人受骗最多?日前,43家消费维权单位联合发布了《“打击网络欺诈 确保消费安全”分析报告》,揭开了网络诈骗背后一些你不知道的秘密
什么时候骗子最活跃?
去年&双11&、&双12&和圣诞节后,以电商之名的诈骗活动也随之增多,其中以电商退款诈骗居多。今年&元旦&、&春节&假期,全国各地返乡、旅游热潮出现,各种退票改签诈骗增多。春节期间,阿里、腾讯等各大厂商发动红包大战,随之而来的是各种虚假红包诈骗急剧增多。从具体时间看,周一、周五的举报量占35%,高于一周中其他时间;而周六、周日举报数量最少。这与用户网上消费习惯有很大的关系。
诈骗信息怎么传播?
从欺诈信息传播途径来看,短信仍是诈骗主渠道社交软件在诈骗信息传播过程占据重要的地位在分类信息网站中,58同城、赶集网占比最高,达75.73%
未知32453 电话短信21093 电商网站12736 分类信息8167
超3成中奖欺诈冒充浙江卫视
中奖欺诈是被举报最多的类型。诈骗分子往往打着这些综艺节目的名义,通过手机短信、QQ、微信、邮件等手段向用户发送中奖诈骗信息。
男性视频交友中最易受骗
女性被骗比例最高的类型为网络购物、虚假兼职和退款欺诈。这几类诈骗,女性受害者占比超过60%。
在赌博博彩、视频交友中,被骗的90%是男性。特别是视频交友中,男性占比更是高达98.6%。
男性和女性在不同的网络诈骗中被骗几率明显不同从年龄看,80后、90后受骗者占八成多。
哪些省份的受害者最多?
四川 河南山东 湖北
从用户举报地域分布来看这四个省级行政区的被骗用户最多,占用户举报总量的55.6%。
民以食为天,食以安为先。3&15前夕,济南等40个省市消协(消委会、消保委)与中国消费者报社、中国消费网共同发布的《全国食品安全调查报告》显示:在13万多名参与调查的消费者中,有四成多不细看食品标签及说明;79.46%的消费者表示对食品安全问题&遇到过,但较少&;六成多消费者遇到过食品生产日期、保质期不易辨识的情况;六成多消费者认为食品生产加工环节最易出问题;遇到食品安全问题后选择找商家要求退换或赔偿的消费者占比最高,同时仍有19.91%的消费者&忍气吞声,自认倒霉&。
86%消费者认为路边摊问题最多
消费者在购买食品场所的选择上,92.89%的消费者通常会在超市等大型购物场所购买食品,占比最高;五成多的消费者会选择便利店和农贸批发市场,还有三成多的消费者会选择网店和食品零售店。同时,86.51%的消费者认为路边早、夜市或小摊最容易出现食品安全问题,占比最高;其次是网店,有57.13%的消费者认为网店最容易出现食品安全问题;相比较而言,超市等大型购物场所的食品还是比较让人放心的,只有11.17%的消费者认为这里容易出现食品安全问题,占比最低。
六成不关注添加剂及安全标识等信息
消费习惯上,44.37%的消费者在购买食品之前会查看包装标签及说明,但看得并不仔细;同时有1.53%的消费者根本不看。在&消费者关注食品包装上的哪些信息&中,92.42%的消费者表示会关注食品的生产日期和保质期,而有四成多的消费者却不关注食品的生产厂家、厂址及产品成分等信息;还有六成左右的消费者不关注食品添加剂、贮存条件、规格、净含量及食品安全标识等信息。这说明很多消费者还须不断提高食品安全意识,确保自身消费安全。
受品牌和价格的影响最大
消费者在选购食品时,受品牌、价格的影响最大,分别有77.04%和76.77%的被调查者会受到这两个因素的影响。另外,因为食品的特殊属性,75.97%的被调查者表示食品的生产日期与保质期也是影响他们选择的一个重要因素。但近半消费者对食品的色泽、外观等感官方面并不敏感,六成多消费者没受到产品成分、生产厂家的影响。
生产日期、保质期等没有显著标注
此次调查结果显示,79.46%的消费者表示对食品安全问题&遇到过,但较少&,另有14.96%的消费者则表示经常遇到,仅有5.56%的消费者表示还未遇到过此类问题。
在消费者遇到的食品安全问题中,&食品的生产日期、保质期等事项没有显著标注、不易辨识&占比超过60%;&宣传虚假或夸大&、&餐饮企业生产环境脏、乱、差,卫生不达标&和&标注虚假生产日期、保质期或者过了保质期还在销售&三种情况的占比均超五成;另有四成消费者遇到过食品掺假掺杂、腐败变质、霉变生虫、污秽不洁、混有异物或者感官性状异常的情况;还有两成多的消费者表示遇到过&超范围、超限量使用食品添加剂&、&农药残留、兽药残留、重金属等污染物含量或致病性微生物超标&、&转基因食品没有按照规定显著标示&及保健食品的标签、说明书涉及疾病预防、治疗功能,没有声明&本品不能代替药物&等违法情况。
处理方式多半选择找商家要求退换或赔偿
那么,在遇到这些食品安全问题之后,消费者会如何处理呢?调查显示,选择找商家要求退换或赔偿的占比最高,为56.70%,向行政部门或消协投诉的,排在第二位,占比17.81%;直接联系生产厂家的则较少,仅为4.29%。同时,仍有19.91%的消费者在遇到问题食品后,会选择&忍气吞声,自认倒霉&。
在对我国食品安全形势的总体看法方面,51.25%的消费者持悲观态度,认为问题很多,并表示担忧;33.07%的消费者则持相对乐观的态度,表示&有些问题,但可以解决&;还有15.62%的消费者更为积极乐观,认为形势正在往好的方向发展。
从造成食品安全问题的原因来看,七成多的消费者认为不法食品生产经营者利欲熏心,而相关部门执法不严,监管力度不够,以及对不法食品生产经营者的惩罚力度不够,是造成食品安全问题的主因;还有54.20%的消费者将原因归咎于自身,认为消费者对食品安全知识的欠缺以及自我保护能力不足,也导致了食品安全问题的产生。
来源:舜网-济南时报
声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。
相关精彩内容推荐
不容错过的资讯
大数据学堂
大数据企业推荐
大家都在搜当前位置:&>&&>& >
数据猿专访智链CEO董宁:区块链市场尚缺杀手级应用
大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。
更多问题咨询,欢迎点击!
你可能也喜欢这些
在线客服咨询
在线客服咨询数据猿专访李刚:搜索到大数据,搜狗一直在路上!
来源:数据猿 记者:春夏
坐在搜狐网络大厦里面,李刚感慨万千:搜狗公司原本作为搜狐公司一个小项目组,由原来13个人的创始团队发展壮大到现在2400多名员工,并已接管整个搜狐网络大厦。如今,搜狗全线产品的月活用户超过5.21亿,已然是中国互联网公司用户规模最大的几家公司之一。而李刚就是原搜狗13个“种子军”团队的其中之一,在搜狗13年的发展中,他亲历了搜狗飞速式的发展历程。
从搜狗搜索引擎到搜狗输入法,再到搜狗浏览器,李刚原本带领的搜狗营销事业部的团队也创造了一个又一个飞跃,无论是搜索广告还是网盟广告,亦或是品牌广告,其营收增长迅速,已让搜狗成为整个中国互联网公司营收排行榜中领先的企业。
越是优秀,越会勇往直前。2014年,李刚又带领团队创建了搜狗大数据研究院并担任院长,深入探索大数据精准营销、竞价广告等领域。
他告诉数据猿记者,搜狗的发展目标是让产品更加智能化,为用户带来更好的体验,而大数据技术可以帮助搜狗做到这一点。
从“搜索引擎”到“大数据”
李刚接受数据猿记者专访时,热情又亲切。通过他直接、坦率的表达,记者了解到很多搜狗在发展过程中不为人知的故事。
2003年,清华大学毕业的王小川加入搜狐公司,那时候,恰巧是搜狐要做搜索引擎项目的时候,王小川认为清华学生编程能力强,于是他从清华大学召集包括李刚在内的12个师弟,组成团队创办了第三代互动式中文搜索引擎——搜狗。
谈起当时加入搜狗的初衷,李刚说:“我在清华大学时就认识王小川,他比我大四届,是一个很靠谱的人,能力也很强。而且搜索引擎原本就属于技术含量很高的项目,所以我当时就加入了进来。”
2003年,清华大学计算机系硕士毕业的李刚到搜狗工作时,负责搜狗网页搜索技术。2008年,搜狗搜索引擎逐步发展成熟之后,便开始转型,将搜索引擎商业化,接入广告业务,推出“搜狗搜索”,于是李刚又开始转做广告产品。
回忆过去,李刚坦言:“从开始做搜索引擎到现在,搜狗搜索已经发展非常成熟,我很幸运能够与它一起成长”。
随着越来越多的积累和沉淀,搜狗开始向更高层次过渡。李刚透露,搜狗给自己的定位是做智能化产品。而通过大数据创造出的更多智慧,就是搜狗一直想探索的事情。因此,搜狗于2014年成立大数据研究院,由李刚担任院长。
重视“智慧”的搜狗,也在日,宣布捐赠清华大学1.8亿元人民币,共同成立“天工智能计算研究院”,重点关注和开展人工智能领域的前沿技术研发,未来会陆续将研发成果应用于搜狗下一代产品中。
“数据”+“技术”是大数据企业发展的基础
如今,已开始在大数据领域进行探索的李刚,对如何做好大数据有一套自己的想法。在他看来,企业做大数据的首要基础是能够覆盖足够多的用户群,积累海量数据源,并做出相应产品。
在这一点上,李刚对搜狗很是自信。
近年来,搜狗不光做了搜索引擎、搜狗浏览器、搜狗输入法,还做了儿童智能手表这样的硬件产品。
可以说,在搜狗13年的发展历程中,已积累、沉淀了大量用户,以及海量数据。
目前,搜狗与国内15家主流手机品牌都达成了深入合作,每天有2亿台手机默认使用搜狗搜索,用户在点击大量URL的同时,表达着自己的关注点和兴趣爱好。此外,搜狗还拥有QQ、微信、知乎的独家合作,以及明医、英文等垂直频道的优质内容,这意味着其能够覆盖和影响更多优质用户群体。
“作为大数据企业,只有数据源还远远不够,必须具备足够强大的技术支撑才会发展的更好。目前来看,其实很多企业并不具备大数据处理技术,如果没有足够强大的技术能力,就无法发挥海量数据的价值。”李刚坦言。
今天,搜狗公司所有的员工当中,工程技术人员已超百分之八十。同时,其还拥有两万台服务器提供技术支持。客观来说,搜狗已经拥有了行业领先的大数据平台,同时还在跨屏收集+联动能力、覆盖率、技术上形成了独有的优势。
然而,李刚却并不满足于此,他表示,搜狗工程师依然致力于数据处理能力的不断优化升级。
大数据让产品变得更加“智能”
企业拥有数据源和大数据技术的目的是为企业和用户提供更好的服务。李刚强调,无论是做哪种大数据应用,关键是要让大数据概念落地,并产生实际应用价值。
他说:“这也是搜狗大数据研究院要做的事情。我们利用大数据技术,对搜狗搜索引擎、搜狗输入法以及广告等产品产生了很大价值,这是已经验证过的事情。”李刚对此颇为自豪。
以搜狗的广告业务为例,利用大数据技术,便可达到精准营销目的。在搜狗所接的广告业务中,搜狗要求客户投放的所有广告都不能随意跳出,所推送广告都要最大程度契合用户需求,这样才能让用户不但不反感广告,还会认可广告,最终实现广告投放的有效性。
为此,搜狗利用大数据技术,以多屏采集的数据层为基础,从人口属性、兴趣属性以及商业属性给用户群打标签,从而建立精准人群竞价系统、网民人群流量切分系统。
李刚称:“我们通过分析用户行为和技术手段,已为5.21亿人群打上标签,一级标签包括几十个一级分类、上千个二级分类、数十万个三级分类。此外,我们为用户打标签的准确率已达90%以上,这样就能够实现精准营销。”
如今,搜狗利用大数据技术已经做到:不同用户在搜狗搜索同一个关键词时,其搜素结果和广告展示结果都不一样。搜狗拥有上亿广告库,系统会根据用户的性别、年龄、学历、个人爱好等标签属性,自动判断为其推送哪些广告。如果用户经常忽略推送的广告,那么展示在其面前的广告就会越来越少。
除了广告业务得到提升以外,大数据挖掘技术也让搜狗搜索引擎变得更加智能化。
李刚称,以前用户搜索关键词时,系统只会显示与其最直接相关的结果。而现在如果搜索“刘德华的妻子的爸爸是谁”等复杂问题时,系统会直接显示其推理以后的结果,也就是会直接告诉用户结果——朱金城。这样就不仅仅只能搜索一个简单的语义,还可以通过逻辑关联,挖掘出用户搜索查询背后的思想,直接告诉用户最终结果。
“这是搜狗搜索引擎从第三代到第四代最大的变化,也是搜狗未来的智慧战略。”在李刚的设想中,未来的搜狗搜索引擎就是一个自动问答系统,用户向系统提问,系统直接告诉用户答案,而不只是传统的简单文字检索。
大数据让搜狗的产品功能变得更加“聪明”的同时,也帮助搜狗广告提升了变现能力,其中很大一部分是搜狗大数据所做出的贡献,这也使李刚更加坚定在大数据领域发展的信念。
“对内+对外”布局大数据
然而,李刚并不想局限于利用大数据帮助搜狗“赚快钱”。李刚透露,他当时创办搜狗大数据研究院有两个目的:一是帮助搜狗提升产品和用户体验,二是希望搜狗大数据能够“走出去”,与业内有更多互动,推动中国大数据产业的发展。
为了让搜狗大数据能够更快“走出去”,李刚已经开始带领他的团队进行新一轮探索。
李刚说:“我们的大数据精准营销模式正在向多元化方向发展。现在搜索广告是按照关键词维度售卖,其实还可以按照人群行为维度进行售卖。以化妆品广告为例,可以利用不同的女性用户行为标签,将不同化妆品广告推送到对应的用户中,比如将A化妆品广告投放到18-25岁女性中,而将B化妆品投放到25-30岁白领女性中。”
同时,李刚对搜狗大数据研究院未来的发展方向也做了详细规划:
首先,会带领团队将搜狗大数据技术提升一个台阶,将真正的智慧与大数据相结合,利用海量数据和标签体系,提高搜狗标签的准确性和精准度。
其次,不仅要将大数据从PC端到移动终端的用户行为打通,引入更多数据和信息,使整个广告展示更加智能化,提升用户体验,还要让搜狗大数据为搜狗输入法、搜狗地图等其他产品带来更多价值。
最后,李刚坦言,搜狗大数据研究院是一个开放的平台,希望能够为公众提供更多服务,并与更多企业进行更加广阔的合作,共同探索大数据的价值。
注:本文记者春夏(微信:)。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点互联网+智库
? ? ? ? ? ?
当前位置: &
& 2017年大数据领域哪些方向值得投?
2017年大数据领域哪些方向值得投?
http://www.100ec.cn&&日09:59&&中国电子商务研究中心
  (中国电子商务研究中心讯)2016年刚刚过去,这注定是被铭记的一年。在这一年里,猿采访了七十多位领域专家、学者以及创业者。他们用理念和实践推动着产业发展。  我们对这些专访进行了整理,推出【大佬专访盘点】系列,和你一起回顾不平凡的2016。  一、&金牌投资人&章苏阳:我们投资的12家企业中9家是技术型  在风投&江湖&中,作为第一代VC代表,章苏阳见证了中国VC行业从筚路蓝缕到现在的空前繁荣,一度享有中国&金牌投资人&的美誉。褪去光环,回归本真后,现在的章苏阳只有一个重要身份&&火山石资本创始人。重点关注、医疗健康和智能技术三大领域,且投资占比为4:3:3,投资阶段一般是企业A轮到B轮融资。  &在我看来,互联网虽然解决了信息不对称,但是从明年起,市场上将会很少有企业再自称是&互联网公司&。投资人已经开始越来越多的以技术角度看企业发展,未来以技术为驱动的创新企业在市场竞争中才更具优势。并且,我所看重的技术并非单纯的技术,而是能够产生更多优质服务的技术。&  二、华创资本熊伟铭:AI是一门&叫好不叫座&的生意,我不会投太多钱  熊伟铭,华创资本合伙人,主导了对一呼医生、猎上网、么么嗖、微知等企业的投资。在加入华创资本之前,他是贝塔斯曼投资基金合伙人。此前,熊伟铭先生还是中经合集团合伙人;在加入中经合之前,担任Piper Jaffray中国分析师。  丰富的投资经验和创业经历都让熊伟铭在选择企业或项目时,能够保持清醒,并遵循自己的投资原则,同时也让他对投资市场有了更加深刻和透彻的认识。  对于项目:&虽然中国市场钱多,但也很难找到好项目!&  对于创业者:&是不是&独角兽&项目,你说了不算!&  对于行业趋势:资本其实一点也不寒冬,需要的是更多优秀创业者  三、六禾创投总裁王烨:我们偏爱&以为驱动&的创业公司  因为我们专注于大数据,所以希望所投企业一定要跟数据应用有关,可以是技术型,也可以偏应用型的公司。  首先,数据应该是这家公司业务成长中很重要的手段,如果不需要数据来驱动公司的业务发展,数据的使用不是自己的核心能力,那可能就不在我们六禾创投关注的范围了;其次就是关于人跟团队了,但这是一个泛泛的因素。  其次,我们认为金融数据领域的发展机会也非常多,如果有这样一个团队,并且能有一些前瞻性思考的话,我们也特别愿意扶持这样的初创企业。  四、青域基金执行总裁牟颖:封闭传统的能源行业将会涌现大量创业创新机会  能源大数据创业门槛有多高?  牟颖认为,能源行业拥有很高的创业门槛,这也是缺乏能源大数据方向创业公司的主要原因。  一方面,能源行业所处的体系是一个较为封闭的系统。作为和国计民生息息相关的行业,政府决策在行业内起到了至关重要的作用。在这样一个市场化程度较低的体系中,企业的决策常常会被政策主导,纯商业的行为常常会在体系中受挫。而且能源行业中的创新成本非常高,这直接导致了创业、创新的氛围没有其他行业那样踊跃。  另一方面,能源行业是一个重资产、重积累的行业。在能源行业中创业,需要创业者拥有的不仅仅是好的idea、足够的热情和勤奋,更需要拥有产业资源、一定规模的启动资金、人脉和产业认知方面的深厚积累。这些条件限制了绝大多数创业者,也让能源行业变得&生人莫入&。  五、信天创投蒋宇捷:红利结束,下一个风口是人工智能  信天创投合伙人蒋宇捷在接受数据猿记者采访时说到,除了创业者自身浮躁原因以外,外部的市场大环境也是导致其失败的因素。  作为业界资深的前创业者和现投资人,蒋宇捷认为,创业圈之所以出现&资本寒冬&,是因为从互联网发展史来看,不论是之前的、,还是P2P,都是由大火到跟风,然后出现断崖式的下降过程,行业无一不是呈现周期性的发展趋势,因此创业者融资时愈发不顺利。另外,当股灾出现以后,实体经济遇到比较大的瓶颈和困难,这种困难传递到一级市场,投资机构便更加谨慎的利用手中资金。  六、GMGC创始人兼秘书长、光合资本创始人宋炜:我看好大数据在大健康、文创、零售、智慧城市领域的应用发展  第一,我们未来身体的数据,健康的指数,每一天的变化都是可以通过大数据模型得出来,而且能指引我们什么时间吃药、吃什么药,这是大数据在大健康领域最直接的作用。  第二,根据预测的2016年经济形势变化,国家提出创新、改革,文创方面的战略,也有大量文化娱乐产品会出现在我们生活中,今天在上讲的TFBOYS就是一个例子,这群时代偶像,他们带来了粉丝经济,粉丝无论追捧的是电视剧还是喜欢的衣物、时尚标签都与TFBOYS性格息息相关,在未来数字娱乐化方面都是很好的应用。假如你要做一场演唱会,正在想用什么样的方式营销,那么,这群粉丝就跟TFBOYS的喜好非常相关了。未来,大数据应用会让我们更精准的获得用户、服务用户,我觉得就是我刚刚讲的文创领域。  第三,未来大数据与零售,比如汽车也息息相关,我们会发现买车前后的事情都与大数据相关。车前,购买车你可以通过大数据分析到用户的收入还有他心理购买的预期。车后,可以购买服务,比如说保险,以及其他衍生品。未来,这些都会成为大数据指导购车的方向。 (来源:数据猿)
&&&&新年伊始万象更新。近日,最富知名度的权威电商智库中国电子商务研究中心发布《2017年度中国电子商务行业年度系列报告》计划,并将稀缺行业报告资源限额开放(专题:)。据悉,首批公开发布行业报告包括5大领域、39份重磅报告:(1)跨境电商类,包括进出口跨境电商、跨境电商政策研究、城市跨境电商、出口跨境电商卖家等细分报告;(2)零售电商类,囊括网络零售、新零售、农村电商、社交电商、二手车电商、生鲜电商、母婴电商、精选电商、网红电商、移动电商、智能硬件等热门领域;(3)服务电商类,涉及共享经济、在线外卖、在线差旅(OTA)、在线教育等细分行业;(4)企业电商类,包括B2B电商、大宗电商、企业在线采购、钢铁B2B、快消品B2B、B2B在线供应链金融等热门领域;(5)电商行业类,包括:电商投融资数据、电商上市公司评级、电商物流、电商金融、电商产业园、电商人才招聘;(6)电商权益类,有电商投诉、跨境网购消费者权益研究、互联网+法律等专项研究报告。报告将通过中心门户网站、自媒体平台、近百万用户数据库、逾3000+名注册记者库等全媒体渠道公开发布。
【】【】【】【】【】
「关键字」
& &(1)凡本中心注明“来源:中国电子商务研究中心”或带有中国电子商务研究中心水印LOGO的所有文字、图片、音频、视频及其他任何形式的作品 ,其版权均属中国电子商务研究中心所有,任何媒体、网站或个人未经本中心协议授权不得转载、链接、转贴或以其他方式复制发布/发表。已与本中心协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国电子商务研究中心”,违者本中心将依法追究责任。
& &(2)转载或引用本中心内容必须是以新闻性或资料性公共免费信息为使用目的的合理、善意引用,不得对本中心内容原意进行曲解、修改,同时必须保留本中心注明的“稿件来源”,并自负版权等法律责任。
& &(3)对于不当转载或引用本中心内容而引起的民事纷争、行政处理或其他损失,本中心不承担责任。
& &(4)凡本中心注明“来源:xxx(非中国电子商务研究中心)”的文/图等稿件,均转载自其它媒体、网站与机构,其转载目的在于传递更多信息,并不代表本中心赞同其观点和对其真实性负责,请读者仅作参考,并请自行核实相关内容,如其他媒体、网站或个人从本网下载使用,必须保留本网注明的“稿件来源”,并自负版权等法律责任。& &(5)关于本中心发布的用户投诉稿件,信息均由用户通过本中心投诉通道提供,本中心不对其真实性负责,若内容真实性有误,请与本中心联系,本中心将在核实后进行处理。& &(6)对不遵守本声明或其他违法、恶意使用本中心内容者,本中心保留追究其法律责任的权利。& &(7)如因作品内容、版权和其它问题需要同本中心联系的请发送相关内容至邮箱:)& &此版权声明解释权归中国电子商务研究中心所有。
&  新年伊始万象更新。近日,最富知名度的权威电商智库中国电子商务研究中心发布《2017年度中国电子商务行业年度系列报告》计划,并将稀缺行业报告资源限额开放(专题:http://www.100ec.cn/zt/2017bg/)。  ...
生态型企业:
行业热点:
曝光专区:
中国电子商务研究中心 版权所有Hadoop是低成本的大数据解决方案?别逗了!
【数据猿导读】
国内做大数据,基本就这两个选择:自建Hadoop或者使用阿里云的MaxCompute(就是原来的ODPS)。你可能不知道这里的成本到底有什么差别,本文我们就来对比一下这两个主流的技术选型
Hadoop是当下流行的并行计算体系,横向扩展、生态圈成熟等一直是它的主要特点。但这些特点当中,绝对不包含廉价。
可能你认为的低成本,实际上只是硬件和软件授权成本,而不是总体成本。在学习成本、开发成本、管理成本上Hadoop并不总是占优。现在伴随公有云技术的成熟,Hadoop甚至连硬件成本也不占优了。
Hadoop与阿里云MaxCompute的成本对比
国内做,基本就这两个选择:自建Hadoop或者使用阿里云的MaxCompute(就是原来的ODPS)。像Amazon、Google、微软的在国内基本处于不可用或者很难用的状态。
这里,我们就来对比一下这两个主流的技术选型:
以企业拥有10TB数据为例,自建hadoop集群,则至少需要6台机器(3nodes+2NameNode+1jobtracker),成本在20万左右。除此之外,还需要投入机房资源,网络设备和运维成本。这其中主要是运维成本,要知道一个运维人员的成本一年至少15万。这样,整体算下来要55万左右。
如果采用阿里云的MaxCompute,按照现在的报价,大约需要32160(存储费用)+45000(计算费用)=77160元。也就是说二者的成本差距在7倍以上。
按照Hortonworks首席技术官EricBaldeschwieler关于成本的陈述,就更为夸张:硬件成本只占Hadoop数据中心总成本的20%。
掀开Hadoop的盖子 这些隐性成本你需要知道
&Hadoop是一个框架,不是一个解决方案&&&在解决的问题上人们误认为Hadoop可以立即有效工作,而实际上对于简单的查询,它是可以的。但对于难一些的分析问题,Hadoop会迅速败下阵来,因为需要你直接开发Map/Reduce代码。出于这个原因,Hadoop更像是J2EE编程环境而不是商业分析解决方案。 所谓框架意味着你一定要在之上做个性化和业务相关的开发和实现,而这些都需要成本。
同时,因为Hadoop庞大的生态系统,也导致了学习成本奇高。目前Hadoop生态中包括了几十种相关的产品,常见的就有:MapReduce、HDFS、Hive、hbase、YARN、Zookeeper、Avro、JAQL、PIG、solr、mesos、shark、stream、storm。熟悉这些产品的部署步骤、功能特性、开发方法都需要付出高昂的学习成本。
有开发者评论说,&它变得好像是用一个锤子来建造一个房屋&,这并不是不可能,但是带来了&不必要的痛苦和可笑的低效成本&。
来源:数据猿
声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。
相关精彩内容推荐
不容错过的资讯
大数据学堂
大数据企业推荐
大家都在搜

我要回帖

更多关于 数据猿公司怎么样 的文章

 

随机推荐