商业智能(BI)用户的底线是什么?宏图上逸园远见的商业智能怎么样啊?

商业智能BI的三个层次
&查看:(12763)
摘要: 经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为OLT ...
经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为OLTP(Online Transaction Process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历史数据。但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。业务人员所需要的是信息,是他们能够看懂、理解并从中受益的抽象信息。此时,如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能主要解决的问题。如何把数据库中存在的数据转变为业务人员需要的信息?大部分的答案是报表系统。简单说,报表系统已经可以称作是BI了,它是BI的低端实现。 现在的企业,大部分已经进入了中端BI,叫做数据分析。有一些企业已经开始进入高端BI,叫做数据挖掘。而我国的企业,目前大部分还停留在报表阶段。数据报表不可取代传统的报表系统技术上已经相当成熟,大家熟悉的Excel、水晶报表、Reporting Service等都已经被广泛使用。但是,随着数据的增多,需求的提高,传统报表系统面临的挑战也越来越多。1. 数据太多,信息太少密密麻麻的表格堆砌了大量数据,到底有多少业务人员仔细看每一个数据?到底这些数据代表了什么信息、什么趋势?级别越高的领导,越需要简明的信息。如果我是董事长,我可能只需要一句话:目前我们的情况是好、中还是差?2. 难以交互分析、了解各种组合定制好的报表过于死板。例如,我们可以在一张表中列出不同地区、不同产品的销量,另一张表中列出不同地区、不同年龄段顾客的销量。但是,这两张表无法回答诸如“华北地区中青年顾客购买数码相机类型产品的情况”等问题。业务问题经常需要多个角度的交互分析。3. 难以挖掘出潜在的规则报表系统列出的往往是表面上的数据信息,但是海量数据深处潜在含有哪些规则呢?什么客户对我们价值最大,产品之间相互关联的程度如何?越是深层的规则,对于决策支持的价值越大,但是,也越难挖掘出来。4. 难以追溯历史,数据形成孤岛业务系统很多,数据存在于不同地方。太旧的数据(例如一年前的数据)往往被业务系统备份出去,导致宏观分析、长期历史分析难度很大。 因此,随着时代的发展,传统报表系统已经不能满足日益增长的业务需求了,企业期待着新的技术。数据分析和数据挖掘的时代正在来临。值得注意的是,数据分析和数据挖掘系统的目的是带给我们更多的决策支持价值,并不是取代数据报表。报表系统依然有其不可取代的优势,并且将会长期与数据分析、挖掘系统一起并存下去。数据挖掘看穿你的需求广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是BI。但从技术术语上说,数据挖掘(Data Mining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的提炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。关联销售案例:美国的超市有这样的系统:当你采购了一车商品结账时,售货员小姐扫描完了你的产品后,计算机上会显示出一些信息,然后售货员会友好地问你:我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗?这句话决不是一般的促销。因为计算机系统早就算好了,如果你的购物车中有餐巾纸、大瓶可乐和沙拉,则86%的可能性你要买一次性纸杯。结果是,你说,啊,谢谢你,我刚才一直没找到纸杯。 这不是什么神奇的科学算命,而是利用数据挖掘中的关联规则算法实现的系统。每天,新的销售数据会进入挖掘模型,与过去N天的历史数据一起,被挖掘模型处理,得到当前最有价值的关联规则。同样的算法,分析网上书店的销售业绩,计算机可以发现产品之间的关联以及关联的强弱。数据报表、数据分析、数据挖掘是BI的三个层面。我们相信未来几年的趋势是:越来越多的企业在数据报表的基础上,会进入数据分析与数据挖掘的领域。商业智能所带来的决策支持功能,会给我们带来越来越明显的效益。
本文仅代表作者观点,其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如果本文内容有侵犯你的权益,请发送信息至service@ukettle.org,我们会及时删除
刚表态过的朋友 ()
流大数据分析· Storm: Apache Storm是一种开源的分布式实
待我君临天下,许你四海为家;待你君临天下,许谁四海为家
  想象中的春季里,应该阳光明媚,而最先感觉到季节变化
经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、O
Powered by &&uKettle
Copyright & 2014BI+BW+BO仓库管理(23)
为了让读者更加清晰地把BI与MIS系统区别开来,本文讨论了BI与DSS(决策支持系统)、EIS(经理执行系统)的主要区别。最后,本文分析了制约BI健康发展的若干因素。
&&& 商业智能(BI)是目前在国外企业界和软件开发界受到广泛关注的一个研究方向。可以用两点来总结这种研究热点出现的原因:一、信息技术的高速发展带来了企业利用信息技术提高本身竞争力的巨大空间:信息技术不但使企业获取需要的信息,而且,促进企业对信息的再利用,以此营造企业的竞争优势;二、IT界许多以提供软件平台和工具平台的大公司通过多年与企业的交流,已经认识到企业对商业智能的迫切需求,纷纷加入到从事商业智能的研究与开发上来。IBM建立了专门从事BI方案设计的研究中心,、微软等公司纷纷推出了支持BI开发和应用的软件系统,有的直接进入了BI的开发领域。
  由于BI尚处于从起步阶段到发展阶段的转变时期,许多人对BI的理解存在一定的偏差。很多人认为BI仅仅是一个进行数据分析的软件包,一些较为悲观的人认为BI是存在于理想家头脑中的、企业永远不可能达到的境界。本文首先系统地诠释了BI的概念,从多个方面总结了BI具有的功能,接着分析了BI的研究内容和发展趋势。为了让读者更加清晰地把BI与MIS系统区别开来,本文讨论了BI与DSS(决策支持系统)、EIS(经理执行系统)的主要区别。最后,本文分析了制约BI健康发展的若干因素。
  1.商业智能概述  
  商业智能不是一个新名词。多年来,企业一直在寻找对商业智能的理解和实现的方式,以增强企业的竞争力。早在80年代,当时“商业智能”的标准是能容易地获得想要的数据和信息。90年代是商业智能真正起步的阶段。到目前为止,关于BI还没有统一的定义,不同的人只是从不同的方面表达了对BI的理解。早在90年代初,Garter Group的Howard Dresner把EUQR(终端查询和报表)、DSS、OLAP称为商业智能。企业使用这些工具使企业获得的优势也被称为商业智能。后来,出现了数据仓库、数据集市技术,以及与之相关的ETL(抽取,转换,上载)、数据清洗、数据挖掘、商业建模等,人们也将这些技术统归为商业智能的领域。目前,存在将商业智能与数据仓库和基于数据仓库的分析方法等同起来的认识趋势。
  其实,商业智能代表为提高企业运营性能而采用的一系列方法、技术和软件的总和。商业智能,是帮助企业提高决策能力和运营能力的概念、方法、过程以及软件的集合。对该定义的正确解释,从四个层面展开:
  信息系统层面:称为商业智能系统(BI System)的物理基础。表现为具有强大决策分析功能的单独的软件工具和面向特定应用领域的信息系统平台,如SCM、CRM、ERP。与事务型的MIS不同,商业智能系统能提供分析、趋势预测等决策分析功能。
  数据分析层面:是一系列、工具或模型。首先获取与所关心主题有关的高质量的数据或信息,然后自动或人工参与使用具有分析功能的算法、工具或模型,帮助人们分析信息、得出结论、形成假设、验证假设。
  知识发现层面:与数据分析层面一样,是一系列算法、工具或模型。将数据转变成信息,而后通过发现,将信息转变成知识;或者直接将信息转变成知识。
  战略层面:将信息或知识应用在提高决策能力和运营能力上;企业建模等。商业智能的战略层面是利用多个数据源的信息以及应用经验和假设来提高企业决策能力的一组概念、方法和过程的集合。它通过对数据的获取、管理和分析,为贯穿企业组织的各种人员提供信息,以提高企业战略决策和战术决策能力。
  总之,商业智能的目标是将企业所掌握的信息转换成竞争优势,提高企业决策能力、决策效率、决策准确性。为完成这一目标,商业智能必须具有实现数据分析到知识发现的算法、模型和过程,决策的主题具有广泛的普遍性。这个特点是本文定义商业智能时应特别强调的。
  基于以上定义的商业智能应具有以下功能:  
  数据管理功能:
  从多个数据源ETL(抽取、转换、转贮)数据、清洗数据、数据集成能力;大量数据高效存储与维护能力。
  数据分析功能
  具备OLAP,Legacy等多种数据分析功能;终端信息查询和报表生成能力;数据可视化能力
  知识发现功能
  从大型中的数据中提取人们感兴趣的知识的能力。这些知识是隐含的、事先未知的、潜在有用的信息,提取的知识表示为概念(concepts),规则(rules),规律(regulations),模式(patterns)等形式。
  企业优化功能
  辅助企业建模的能力。
2.BI研究内容、发展趋势  
  商业智能为更好地制订战略和决策提供良好的环境,为特定的应用系统(如客户关系管理CRM、供应链管理SCM、企业资源计划ERP)提供数据环境和决策分析支持。当面向特定应用的特定战略和决策问题,商业智能从数据准备做起,建立或虚拟一个集成的数据环境。在集成的数据环境之上,利用科学的决策分析工具,通过数据分析、知识发现等过程,为战略制订和决策提供支持。最终,是如何解释和执行分析和发现结果的问题。整个过程中,集成的数据环境和决策分析工具是十分重要和不要缺少的。
  使用数据仓库和数据集市建造集成的数据环境是逐渐走向成熟、也是目前最理想的做法。数据仓库提供数据存贮环境,而且是面向特定主题的决策支持环境。来自各种数据源中的数据经过清洗、ETL(抽取,转换,上载),按某一主题存贮。数据集市是面向特定主题的小型数据仓库,解决了企业级数据仓库要存储大量数据而带来的建设周期长、造价高、可扩展性差等缺陷。
  OLAP是基于数据仓库环境的数据分析工具。用户首先提出自己的假设,然后利用OLAP工具检索查询以验证或否定假设,是用户制动式的分析方式。OLAP解决了基于OLTP分析效率低、不能进行多维分析的缺点。相比较而言,知识发现(大多数人也称数据挖掘)是较难理解的,它利用知识发现工具挖掘事先未知的、潜在有用的知识的过程,是一种主动式自动发现方法。图2是文章总结的商业智能系统框架。
  2.1.研究内容
  商业智能是利用当今计算机前沿技术作支撑、运用现代管理技术进行指导的应用系统,它的研究热点集中在三个方面:支撑技术的研究、体系结构的研究、应用系统的研究。&
  2.1.1.支撑技术的研究
  商业智能作为一个在90年代末期出现的跨学科新兴领域,必须借鉴两方面的先进成果,一是计算机技术的前沿技术,一是企业管理方面的新理论、新观点。企业管理方面的新理论、新观点为战略制订和决策提供先进的管理模式,帮助企业更好地运营;先进的计算机技术是提高系统性能的有力手段。
  商业智能的支撑技术包括以下几项:一是计算机技术,包括:数据仓库、数据集市技术;数据挖掘技术;OLTP、OLAP、Legacy等分析技术;数据可视化技术;与WEB技术。二是企业管理,包括:统计、预测等运筹学方法;客户管理、供应链管理、企业资源计划等管理理论和方法;企业建模方法。
  支撑技术的研究主要围绕两部分展开:决策支持工具研究和企业建模方法研究。企业建模是为解决如何建立特定企业模式的辅助工具。IDEF 等研究方法是较程式化的企业建模方法,比较新的建模方法包括基于UML的企业建模等方法。数据挖掘算法的研究是目前计算机界研究的热点之一,它逐渐成为一个跨越、数据统计等多学科的研究领域。决策分析工具的研究还包括各种分析方法的研究。
  2.1.2.体系结构的研究
  图2描述了一个典型的商业智能体系结构。面向特定应用会有相应改进的体系结构,使商业具有良好的性能,例如:建立如何的数据存贮和数据模型能很好地支持主题和数据分析和知识发现的需要;选择何种决策分析工具,包括选择实现何种任务、选择实现这种任务的何种工具;将分析和发现的信息和知识通过何种接口达到需要的用户等等。
  2.1.3.应用系统的研究&
  对应用系统的研究的重点在于对各个应用领域所面临的决策问题的分析。根据对各类问题的解决方式和解决方案来决定商业智能系统应该提供的功能以及具体实现方法。目前,商业智能被广泛应用于与企业运营过程相关的各个领域,并且在很多领域已经形成其特有体系。目前具有代表性的应用领域包括:企业资源计划(ERP)、客户关系管理(CRM)、企业性能管理(BPM)、人力资源管理(HRM)、供应链管理(SCM)、电子商务(E-business)。
  2.2.发展趋势
  与DSS、EIS系统相比,商业智能具有更美好的发展前景。近些年来,商业智能市场持续增长。IDC预测,到2005年,BI市场将达到118亿$,平均年增长率为27%(&Information Access Tools Market Forecast and Analysis: ,& IDC#24779, June 2001)。随着企业CRM、ERP、SCM等应用系统的引入,企业不停留在事务处理过程而注重有效利用企业的数据为准确和更快的决策提供支持的需求越来越强烈,由此带动的对商业智能的需求将是巨大的。
商业智能的发展趋势可以归纳为以下几点:  
  功能上具有可配置性、灵活性、可变化性
  BI系统的范围从为部门的特定用户服务扩展到为整个企业所有用户服务。同时,由于企业用户在职权、需求上的差异,BI系统提供广泛的、具有针对性的功能。从简单的数据获取,到利用WEB和局域网、广域网进行丰富的交互、决策信息和知识的分析和使用。
  解决方案更开放、可扩展、可按用户定制,在保证核心技术的同时,提供客户化的界面
  针对不同企业的独特的需求,BI系统在提供核心技术的同时,使系统又具个性化,即在原有方案基础上加入自己的代码和解决方案,增强客户化的接口和扩展特性;可为企业提供基于商业智能平台的定制的工具,使系统具有更大的灵活性和使用范围。
  从单独的商业智能向商业智能发展
  这是目前商业智能应用的一大趋势,即在企业现有的应用系统中,如财务、人力、销售等系统中嵌入商业智能组件,使普遍意义上的事务处理系统具有商业智能的特性。考虑BI系统的某个组件而不是整个BI系统并非一件简单的事,比如将OLAP技术应用到某一个应用系统,一个相对完整的商业智能开发过程,如企业问题分析、方案设计、原型系统开发、系统应用等过程是不可缺少的。
  从传统功能向增强型功能转变
  增强型的商业智能功能是相对于早期的用SQL工具实现查询的商业智能功能。目前应用中的BI系统除实现传统的BI系统功能之外,大多数已实现了图2中数据分析层的功能。而数据挖掘、企业建模是BI系统应该加强的应用,以更好地提高系统性能。
  3.BI与DSS、EIS的比较  
  商业智能作为一种新兴的决策支持体系,与传统的DSS、EIS相比,在以下方面存在明确的优势。
  3.1.使用对象范围
  商业智能的使用对象不再像DSS、EIS仅仅局限于企业的领导与决策、分析人员,而是扩展到企业组织内外的各类人员,为他们提供决策支持服务,既有企业经理一类的企业领导和高层决策者,又有企业内部各部门的职能人员,还包括客户、供应商、合作伙伴等企业外部用户。
  3.2.具有的功能
  从以上分析看出,商业智能具有传统DSS、EIS所不具有的强大的数据管理、数据分析与知识发现能力。
  3.3.知识库状态
  传统的DSS、EIS中的知识库是在建立的系统中设置好的,库中的知识很少发生变化。即使发生变化,采用定期人为更新的方法修改。而BI系统是一个闭合循环的动态系统。图2中的数据源部分来自各应用系统的反馈,并且数据挖掘可以从现有的数据仓库或数据集市中发现新知识,随时对知识库中的内容进行自动修正,所以BI中的知识库是一种动态结构。
  但商业智能也存在不足。商业智能的目标与DSS一样,是为了提高企业决策的效率和准确性。但BI是通过数据分析、知识发现工具提供有价值的、辅助决策的信息和知识,用户必须根据这些信息和知识,运用现有的企业知识和经验进行判断,做出决定,极少数具备智能决策的能力。不像专门的决策支持系统那样提供方案生成、方案协调、方案评估等功能,更不具备群体决策的能力。
  4.影响BI性能的因素
  商业智能利用数据挖掘不断发现新的知识,扩充到现有的企业知识中来。但就目前企业应用现状和算法实现上来看,制约知识发现的因素较多,同时也影响了BI的性能。
  4.1.系统智能不能很好地实现
  现有数据挖掘算法大多尚不成熟,效率较低。另外,作为BI数据基础的数据仓库或数据集市中数据量一般比较大,新知识形成的速度和准确性比较低,致使现有的BI系统在知识发现方面的能力不能满足用户要求。
  4.2.系统工具缺乏
  目前大多数BI系统功能集中在数据分析方面,如数据查询、报表、OLAP、数据可视化,很少有开发商在系统中配有知识发现工具。因此,功能比较集中,更深一层次的要求无法满足。
  5.结语
  目前,我国对BI的研究与开发工作尚未处于起步阶段。突出的问题在于数据分析、知识发现能力、效率低,或者缺乏知识发现,而更像一个操作型应用系统。很难在决策支持方面发挥BI应有的作用。首先应该认识到BI发展、应用的总体趋势,其次多借鉴国外BI成熟的技术和方法,开发或不断完善真正意义上的BI系统。相信本文对国内BI的市场开发和研究会有启发。
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:3253813次
积分:52517
积分:52517
排名:第55名
原创:1943篇
转载:2467篇
译文:101篇
评论:255条
阅读:4060
文章:10篇
阅读:7978
文章:51篇
阅读:62815
阅读:5880
文章:14篇
阅读:116336
(23)(121)(55)(143)(50)(74)(31)(242)(139)(209)(205)(172)(182)(71)(147)(93)(73)(53)(88)(59)(22)(113)(43)(9)(22)(147)(243)(122)(55)(8)(5)(15)(14)(3)(2)(33)(2)(4)(5)(11)(34)(35)(40)(35)(36)(34)(10)(41)(40)(40)(16)(5)(12)(55)(38)(33)(24)(22)(43)(56)(55)(11)(69)(21)(55)(19)(78)(47)(163)(233)(9)
为你推荐最新的博文~更有惊喜等着你君,已阅读到文档的结尾了呢~~
商业智能(BI)用户的底线
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
商业智能(BI)用户的底线-宏图远见
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口后使用快捷导航没有帐号?
商业智能(BI)需要掌握什么知识,以及发展前景
查看: 5186|
评论: |原作者: 网络转载|来自:
摘要: 智能技术根据商业知识,出报表和建立分析模型,并且运用商业知识检验和解释报表和模型准确与否,而根据出来的报表和分析/挖掘模型结果,又能对商业运作提供数据与决策参考。
一、 &什么是商业智能? 商业智能=商业+智能 商业和智能的关系,如图1:智能技术根据商业知识,出报表和建立分析模型,并且运用商业知识检验和解释报表和模型准确与否,而根据出来的报表和分析/挖掘模型结果,又能对商业运作提供数据与决策参考。
& & &&图1 & & &商业智能=商业+智能 首先是商业检验智能技术。商业目标以及商务流程,限定了你能选用的分析方法,比如客户分类问题,就不能用聚 类解决;商务流程上无法给样本本身打上标签,就很难用分类算法训练模型。忘掉啤酒和尿布吧,那只是个号称刊登在《哈佛商业评论》上的传说,这种业务上 很难解释的事件被传得神乎其神,如果是真的,早被广泛应用了。所以模型一定要在商业上解释得通,通常一两个小概率小范围事件对整体是不会有很大影响的。好 比看起来不错的创新点子,不可能将其实现就产生赚钱的产业链,而是要考虑方方面面的因素以及有效的执行。 其次是智能技术指导商业行为。比如埃森哲 利用数据挖掘对市场/客户进行细分,针对不同行为特征的客户,推荐/制定产品,以期更贴近客户的需求,利用技术指导商业。这是一个考验执行力的过程。目前 许多案例往往是不成功的,其中一个原因在于市场部处于一线经营,主导地位,其话语权通常大于技术部。假设你是一线经营人员,有自己的立场、观点、人脉、营 销模式,甚至讳莫如深的自身利益。让业务人员从工作习惯上去改变,尚且不易,更不用说触碰到他们的利益线了。所以国内很多大型国有企业做出来的BI系统, 很多是做表面文章,耗资百万的系统做好了却闲置。 抛开立场、自身利益因素不谈,国内BI就做得很好了么?答案当然是否定的,这是因为,业务人员不懂技术,技术人员不懂业务。笔者曾经见过一个在移动内部,做了七八年的技术人员,因为有较长的从业经验,跟业务人员沟通比较多,只要业务人员提需求,他就能在极短时间内给出数据,甚至能引导迷糊的业务员理清思路。但他的经验,很难复制,毕竟出了学校,培养一名商业智能从业者应该只有少于1年的时间。 那么让我们从商业和智能的角度,来看看知识分解吧,可以供初学者参考,也可以供高手拍砖,如图2二、 数据和数据仓库 数据是数据分析的基础,数据库是数据的承载,数据仓库是有主题的数据库。 效率高的数据仓库不那么容易设计出来的,多大数据量使用范式设计,多大使用反范式设计,为什么使用反范式设计(空间换时间),哪些表在业务上使用频繁需要分割,哪些字段需要合并成一张常用表等等。 涉及到数据分析的一个问题是数据质量。数据质量又可以分成两大块,“脏”数据的处理和数据来源口径的追溯。前面举的啤酒尿布例子,得到不符合常理的结果后, 应该首先检查数据质量是否有问题。若数据质量有问题,那么后面的分析必然不准确,所谓garbage in garbage out!三、报表 报表这种原始的BI方式有时候是简单有效,但要做一张优秀的报表似乎又要考虑很多问题。首先是确定报表的目的,这样才能定下报表是清单级还是汇总级;其次选 择字段,个人认为应该符合MECE(Mutually Exclusive Collectively Exhaustive),信息不全或者信息冗余,对分析都会形成干扰;再次是对字段做维度聚类,并做重要性排序,重要的,能做分析思路索引的,要排在前 面。当然一张优秀的报表绝不应拘泥于以上,需要在工作中多思考和体会了。四、数据挖掘 数据挖掘讲了很多了。如果往简单来说,可以有 BI=图表+数据挖掘的理解,虽然不甚全面。数据挖掘作为报表这种非智能性BI的一种补充,理论上应该属于的一种,存在着那么一点儿让计算机自学 的能力。按算法来分类也就预测、分类、聚类、关联那么几种,大多都封装好的,使用起来很方便,普通应用只需要知道怎么读数据挖掘软件给出的报告即可,关键 点是紧扣商业理解,难点和被忽视的地方会在接下来的算法知识块提到。至于SAS, SPSS,Modeler, R, MATLAB这些挖掘工具之争,那就见仁见智了。但有一点我很肯定,如果你初学数据挖掘,那么推荐Modeler,简单的操作界面和轻松的DEMO,大大 降低了数据挖掘的入门难度。五、算法 随着面向对象(Orient Object)编程方法兴起,“程序=数据结构+算法”的光荣时代似乎已经一去不复返。如今许多分析人员也不曾听过Knuth和他的The Art of Computer Programming。有一种观点是,在各工具将算法封装得很好的情况下,深入了解算法似乎是没必要的——Just run it。的确,如果你只想做到中级分析师,可以不去理会。但是要成为一名高级分析师,那肯定得有一定深度的研究。一是为了知道针对特定的数据集,选用什么样 的算法,如何抽取样本,抽取多大量的样本(样本出问题,整个项目都完蛋),算法适用条件是什么,比如线性回归的:独立性、常方差、正态性,怎么理解,哪些 必须满足。这些使用如果不熟悉的话,很容易导致分析出问题。一些做这方面工作的BIer,不求甚解,做出来的东西是错的,做分析最可怕的是错了还没意识! 二是客户问到一些问题,知道如何去解释,比如用决策树计算出来的得分,为什么很多样本得分是一样的?客户细分中,有没有算法可以使得同一个客户细分至两个 不同的客户群?没有的话,如何用现有算法解决该客户既有A群属性又有B群属性的问题?三是你能写出针对特定问题的算法,现实中许多问题拥有其他问题一样的 共性,也有它自己的个性,某些时候针对个性的东西越强,分析效果越好,这就需要你手写算法解决。获得Netflix 100万推荐算法大奖的绝不可能是封装好的现成算法不是么。另外还有一类商业智能问题,是封装算法解决不了的,这类问题大多见于与地理结合的GIS决策系 统,这类系统就要求分析人员有图形算法功底。可见如果你想成为顶级的数据分析师,算法与数据结构的知识必不可少。搜索,排序,树,图之所以经典,是因为它 们简单有效而且通用。如果你能把这些算法在数据库里实现,那么你分析技术这方面,确实达到很高的境界了。六、统计学与其中的分析逻辑问题 商业分析中应用统计学的好处在于,你可以不知道两者的因果而只分析两者的联系,并且在环境没有太多改变的情况下,分析结果都是适用的(更复杂的需要使用微分 方程或其他,但提升度未必高)。关于逻辑,我们来看一个例子:据科学家研究,肥胖的人在社交关系上会聚集在一起。如图3,如果你的朋友肥胖,则你肥胖的概 率比别人高45%(紫柱),如果你朋友的朋友肥胖,则比平均高出25%(红柱),如果你朋友的朋友的朋友肥胖,则比平均高出10%(橙柱)。事实上,这些 都是数据和统计,只能说明肥胖的人可能会聚集到一块儿,因为从数据上你无法分辨出你们是因为肥胖而成为朋友(比如因肥胖到健身房认识)还是因为成为朋友而 肥胖(吃货朋友一起去吃东西),或者互为因果。实际分析中,我们经常发现两样事物是互为因果互相加强的,“事物有普遍联系”和“作用与反作用”的哲学原理 在此体现得淋漓尽致。业务经验在此时显得尤为重要!它能告诉我们哪件因素更重要,一般对于业务人员来说更好实现的过程,更好掌控的因素,就是原因,是我们 后续操作的引线和突破口。
图3 相关关系 VS 因果关系(编者注) 关于商业,笔者是技术出身,也处于摸爬阶段。但可以推荐两本书,这两本书是都是国外的,较厚易懂:菲利普科特勒《市场营销》,斯蒂芬鲁宾斯的《管理学》。商业与技术是存在联系的。其实细心的读者会发现,光是有上面的知识还是不够的,纸上得来终觉浅,绝知要做项目呀:)增值知识 作为分析师宽广的知识面必不可少,没事看看心理学、历史、地理、人口统计学(demography),浏览一下知乎,FT中文网什么的,也是不错的。很多优秀的数据信息图、资料、报告只有英文的,例如:数据信息图: &、、资料:&、报告:& 国外在数据规划使用展现比我们前行更远,这点是确认无疑的。所以英文阅读流畅的能力对于一个想当优秀分析师的人来说非常重要。我也曾经想过把一些比较不错的文档翻译过来,但因为相当耗时耗力,只能作罢。与其等待别人翻译,不如自己看。总结一下: 商业智能,是利用计算机对数据大量快速处理的特点,对众多商业数据做图与表的展现分析,并通过统计学的方法对数据进行智能学习和挖掘,辅助商业决 策。商业智能的优势就在于它对海量数据的处理,以及可规则化逻辑化(这点部分继承了数学的DNA),这些杂乱的数据让人去处理和挖掘有用信息,基本是不可 能的。 商业智能目前处于初始阶段,数据仓库准备、跨行业经验整合、商业及技术知识储备、人才培养模式都还刚刚起步。国内BI也还处于积累阶段,都是一些有钱的企业在做试验案例,成败不一。BI从业人员有混生计的,也有认真积累的;有先行者,也有后起之秀。总之,BI离爆发还有一段路要走,没有量的积累,就没有质的飞跃!要想飞跃,你必须完成爬行、站立、走、跑等一系列动作,辛苦甚至痛苦,但这些,在飞跃的那一刻,都会化为喜悦。
刚表态过的朋友 ()

我要回帖

更多关于 宏图上逸园 的文章

 

随机推荐