搜档网
当前位置:搜档网 › 数据仓库在我国企业的应用现状及实施策略分析

数据仓库在我国企业的应用现状及实施策略分析

数据仓库在我国企业的应用现状及实施策略分析
数据仓库在我国企业的应用现状及实施策略分析

广西科学院学报 2006,22(4):375~377

Journal of GuangxiA cade m y of Sciences V ol

.22,N o .4 N ove m ber 2006收稿日期:2006209212

作者简介:何朝红(19652),女,广西南宁人,硕士,主要从事供应链管理和物流信息化研究。

数据仓库在我国企业的应用现状及实施策略分析

On the Appl i ca ti on of Da t a W arehouses i n Ch i n ese En -terpr ises

何朝红

H E Chao 2hong

(广西物资集团总公司,广西南宁 530022)

(Guangx iM aterials Group Corp .,N ann ing ,Guangxi ,530022,Ch ina )

摘要:分析数据仓库在我国企业中的应用现状。认为目前我国企业数据仓库的应用主要存在对数据仓库的概念理解不深,对项目的长期性、艰巨性认识不足,数据库系统中数据的积累不够,用户没有参与数据仓库建设的需求分析,项目实施过程中的管理混乱,具体实现中的技术问题尚未完善等问题。企业应从确定建立数据仓库的合适时机,选择切合实际的实施方法,取得最高管理层的支持和认可,确定基本目标、量化预期收益,选择正确的设计思路,选择合适的合作伙伴等6个方面应用数据仓库技术。关键词:数据仓库 应用 问题 策略

中图法分类号:T P 311113 文献标识码:A 文章编号:100227378(2006)0420375203

Abstract :T he app licati on of data w arehouses in Ch inese enterp rises is discussed .T he p roble m s in

the app licati on are revealed as fo ll ow s

.T he data w arehouse can not be fully understood .T he l ong ter m and hardness of the p roject runn ing are neglected .T here are less data accum ulated in the data w arehouse .T here is lack of users partici pating in the de m and analysis of the data w are 2house establishm ent ,and poor m anage m ent in the i m p le m entati on of the p ro ject .T he technical p roble m s have not been i m p roved in the operati on of the data w arehouse .T he relevant sugges 2ti ons are p resented .For the p roject to be supported ,it needs to choose a correct ti m e and a p rag 2m atic executi on w ay to construct a p ro ject ,set up an essential goal ,m easure the expecting bene 2fits ,and select a suitable partner .

Key words :data w arehouse ,app licati on ,p roble m s ,strategy

近年来,计算机网络和数据库技术的迅速发展和广泛应用,使得企业管理进入了一个崭新的时代,企业的许多业务得到了联机事务处理(OL T P )信息系统的支持。然而,随着市场竞争的加剧,正确及时的决策成为企业生存和发展的重要环节。特别是随着数据库系统的逐日运行,产生了大量的业务数据,如何安全有效地存储和管理这些数据,并从大量繁杂的数据中获取其中有用的决策信息,为高层管理人员提供快速、准确和方便的决策支持,成为目前企业提高管理水平和竞争优势必须解决的问题。数据仓库(D ata W arehouse )技术的产生和发展,为这个问题的解决提供了有效的理论和方法指导。

数据仓库是20世纪90年代初出现的数据管理的

新技术,到20世纪90年代中期已在发达国家的许多行业中得到应用[1]。建立数据仓库的目的,就是把来自企业内部和外部的大量异构数据按辅助决策主题的要求进行加工、集成,为高层管理人员提供各种类型的、有效的数据分析,起到决策支持的作用。因此,数据仓库已经成为继Internet 之后的又一技术热点。

1 数据仓库在我国企业的应用现状

随着各种计算机技术,如数据模型、数据库技术和应用开发技术的不断发展,数据仓库技术也在不断完善,并在实际应用中发挥了越来越大的作用。据美国国际数据公司(I D C )调查,使用数据仓库技术的投资回报率(RO I )平均超过400%,平均回报时间

为2~3年;若从部门级数据仓库(也称“数据集市”)开始实施,则投资回报率平均超过500%[2]。

目前,在美国,30%到40%的公司已经或正在建

造数据仓库[3]。在经济发达国家,大型企业几乎都建立了自己的数据仓库。数据仓库的应用已遍及银行、证券、保险、税务、电信、医疗保健、商业零售业等各个行业和部门。这几年,我国越来越多的企业也逐步认识到利用数据仓库技术获得决策支持的重要性,许多大型企业开始建立数据仓库系统。例如,中国银行广州分行“八五”期间就开始建设数据仓库,包括从数据采集、数据处理到数据存储的全过程;1999年4月,深圳国信证券的数据仓库系统一期工程完成;上海集装箱码头项目、深圳华为、上海强生、上海日立、广东省长话计费系统、新飞集团、浙江省移动通讯计费系统等都已成功地采用了数据仓库技术;上海宝钢、深圳招商银行目前也在创建自己的数据仓库,开展数据分析工作[4]。

2 数据仓库在我国企业的应用中存在的问题

应该指出的是,虽然近几年数据仓库在我国的应用已开始形成热潮,但与发达国家相比还存在着很大的差距。由于我国的生产力水平普遍较低,企业信息化基础建设起步较晚,用于信息化建设的投资力度也较低,因此,要使数据管理上升到数据仓库水平会遇到一些困难。虽然很多企业都在实施数据仓库项目,但成功的却为数不多,问题主要集中在以下6个方面。

211 对数据仓库的概念理解不深

数据仓库中的数据不是简单的数据拷贝,而是按决策主题的要求从OL T P数据库或其他外部数据源中经过复杂的提取、清洗、转换、汇总而得来的;而且,数据仓库中存放的都是历史数据,一旦装入,一般是不会修改的。因此,不能对仓库中的数据进行实时更新,只能周期性地进行刷新,也就是追加新的数据。正是由于对数据仓库的定义理解不深,一些企业在开发中采用复制服务器直接从OL T P系统向数据仓库传播数据,或者允许数据进行实时更新,从而对数据仓库造成灾难性的后果。

212 对项目的长期性、艰巨性认识不足

有些用户以为今天建立了数据仓库系统,明天就能够解决商业竞争中的所有问题,能取得很大的效益。这种急功近利的思想没有充分认识到项目建设的长期性和艰巨性也会影响企业有效应用数据仓库技术。实际上,数据仓库不一定马上就能得到很大的效益,有时候数据仓库中挖掘出来的东西并不一定是很有用的。数据仓库系统的建立是一个不断完善的过程。

213 数据库系统中数据的积累不够

数据仓库中的数据主要是从OL T P数据库中抽取的,而只有在大量数据的基础上进行联机分析处理才可能得到有价值的决策信息。但由于国情所限,目前我国企业在数据库的规模上,与国外企业相比还存在很大的差距;更有甚者,有些企业的数据库由于没有资金维护而变成了“死库”。建设数据仓库系统,没有数据积累是没有任何意义的。

214 用户没有参与数据仓库建设的需求分析

数据仓库的最终用户是企业的中、高层领导或其助手,这与OL T P系统直接面对具体的操作人员有明显的不同。对许多企业来说,要使最终用户与信息技术人员真正在一起合作是较困难的。而且在项目的初始阶段,领导们也往往提不出具体的目标,只是希望信息技术人员对出现的问题能提供快速的解决方案。这就必然导致最后开发出来的系统难以满足用户的决策要求。

215 项目实施过程中的管理混乱

建立数据仓库的目的是大力提高经济效益。然而,执行有效的数据仓库策略的最大障碍常常不是技术方面的。由于集中式数据仓库具有可控性和可靠性,但灵活性不够好,而分布式数据集市具有很大的灵活性但可能会导致各部门之间不能有效地协同工作。因此,在确定数据仓库的功能规模问题上,经常暴露出存在于机构内部关系的复杂性和行政上的种种障碍,从而增加了技术实现上的难度。

216 具体实现中的技术问题尚未完善

数据仓库中的数据可能来自不同的数据源,它们分布在不同的硬件、数据库、网络环境中,为不同的业务部门服务。因此,对这些数据的整合可能会遇到很多技术困难,而如果不能保证数据仓库中数据的高质量,也就很难获得有价值的决策信息。另外,数据分析工具的选择问题,目前仍没有一种大众化的、简单易用的集成工具。

3 我国企业应用数据仓库技术应采取的策略

随着现代社会商业模式变革的进一步普及和深入,数据仓库将成为企业获得竞争优势的关键技术。针对应用中存在的上述问题,我们认为,企业要有效应用数据仓库技术,应采用以下策略。

311 确定建立数据仓库的合适时机

每个企业应根据自己的实际情况,决定要不要

673广西科学院学报 第22卷第4期 2006年11月

建立数据仓库以及何时应用等问题。对于如金融、邮电等行业的企业而言,以前本就有大型数据库的坚实基础,现在利用数据仓库为其开拓更有竞争力的市场就很有必要。而对于国内基础设施尚待完善的中小企业来说,立即上马数据仓库未必是一项明智的选择,因为没有几十万,乃至上百万的资金,是没有办法建立一套数据仓库系统的。而且,如果企业规模比较小,所要处理的信息量比较少,普通的M IS 系统所提供的功能管理已很满意,领导特殊的需求可通过其他手段实现,当然也就没有必要实施或可以暂缓实施数据仓库,而应将有限的资金用在对数据库系统的维护上,为今后建立数据仓库奠定基础。312 选择切合实际的实施方法

数据仓库的建立有两种方法:一是先建中央数据仓库,再根据需要建立相应的数据集市。这种方法可控制性好,便于各部门协调工作,但建设周期长,投资较大,有时数据仓库建好后,企业数据模型已发生变化,所以一般要建立良好的迭代过程来保障系统的增长与完善。二是自下而上先建数据集市,再建中央数据仓库。这种方法建设周期短,费用较低,但建设时必须有全局观点,要保持数据的一致性,便于今后其他数据集市和中央数据仓库的实现。

一般来说,在整个企业对数据仓库建设缺乏成功经验的情况下,从个别数据比较规整且有一定规模的业务子系统入手,先建立扩展性好、部门级应用的数据集市,在成功使用的基础上,再在多个数据集市上构筑面向企业应用的集中式数据仓库,也许是最为现实的方案,而且收效快,风险小。

313 取得最高管理层的支持和认可

对一个企业来说,建设数据仓库是一项投资大、周期长、见效慢的系统工程。如果得不到高层领导在行政上、尤其是财政上的支持,项目的实施就无法进行。而要获得领导的支持,一方面必须在项目的开始阶段就使他们参与进来,了解其对系统功能的需求,因为他们是企业的决策者,是系统的最终用户;另一方面,要让他们尽早了解项目实施的艰巨性和长期性,使其明白数据仓库不是万能的,未来的系统也不可能是十全十美的。只有决策者在一开始就对可能出现的困难有充分的思想准备,才有可能对项目有自始至终的大力支持。此外,在数据所有权和数据存放等问题上的内部纷争,很容易给数据仓库带来进程上的滞延和失败,最高管理层的支持也有助于打破各个部门之间日益严重的数据保护壁垒,为项目的顺利实施扫清障碍。314 确定基本目标,量化预期收益

在项目开始实施以前,用户必须明确建立数据仓库的目的、要解决的问题及应达到的目标;同时,也应该认清哪些是关键性的、影响成功的因素,以便在方案的实施过程中进行跟踪。这些基本目标确立以后,下一个基本要求是对来自数据仓库的预期收益进行量化。量化的目标不一定是数字或金融表达式,而只需要具体明确、有意义即可。目前,许多企业都采用金融衡量标准,比如投资回报率,来对收益进行量化。其他类型的收益衡量标准还包括成本节约程度以及可获得的能够进行衡量的效率等。只有对项目定义目标和量化收益之后,管理层才能有据可依地判断一个数据仓库的成功与否。

315 选择正确的设计思路

由于OL T P系统为功能驱动,而数据仓库系统由数据驱动,因而反映在项目的设计阶段(概要设计和详细设计),前者一般开始于过程分析,后者则从数据分析入手。数据分析又有两个方向,一是从数据提炼需求;另一是从需求寻找数据。所谓从数据提炼需求,就是通过考察企业已有业务系统所提供的数据,分析从这些数据中能提炼出哪些有用的决策信息。这种做法适合于项目开始的原型设计阶段。而从需求寻找数据,则是针对用户的某种应用需求,考察其所需的信息能否从业务系统中抽取以及怎样抽取。在项目的进行过程中,也就是在用户根据原型完善系统的时候,这种做法使用较普遍。

316 选择合适的合作伙伴

在建立数据仓库时,选择合适的合作伙伴非常关键。这些合作伙伴,包括顾问、分销商以及软件和硬件的厂家,对他们的选择一是基于其能力,二是基于其是否具有长期同舟共济的愿望。要充分考虑这些合作伙伴在初始目标实现以后是否还会积极主动地帮助自己解决面临的问题,随着项目的继续推进会出现什么情况,等等。企业只有与所有的合作伙伴进行充分有效的协作和交流,才能取得数据仓库技术应用的最后成功。

参考文献:

[1] 刘东波.数据仓库技术的现状与未来[J].微型机与应

用,2000(7):427.

[2] 张凤荔,葛晓峰,周明天.数据仓库研究及其在现代企

业中的应用[J].计算机科学,1999,26(6):71274. [3] I N M ON,W I L L I A M H.Building the data w arehouse

[M].2nd ed.N e w York:W iley,1996.

[4] 张伟民,董萌,章韵,等.电信网络管理的数据仓库解决

方案[J].计算机应用研究,2000(7):36238.

(责任编辑:韦廷宗)

773

何朝红:数据仓库在我国企业的应用现状及实施策略分析

数据仓库建设的几点建议.doc

北京甲骨文软件有限公司咨询经理鲁百年博士 一、国内信息化的现状 1、信息化建设的发展历史:在国内信息化建设过程中,基本上是按照当时业务系统的需求进行建设,例如:在一个企业中,财务部门为了减少工资发放的差错,提高发放的效率,先建设一个工资发放和管理程序;为了报账和核对的需求,建设一个财务管理程序;在银行首先为了业务处理的方便,将最基本的手工记帐和处理的业务建成一个系统,过一段时间,如果有新的业务推出,就再建设一个新的系统,或在原系统的基础上增加新的业务处理。这样的结果使每个系统和系统之间缺少真正的信息沟通和信息交换。 2、为何要建立数据仓库:前面我们讲过,业务系统各自为政,相互独立。当很多业务系统建立后,由于领导的要求和决策的需求,需要一些指标的分析,在相应的业务系统基础上再增加分析和相应的报表功能,这样每个系统就增加了报表和分析功能。但是,由于数据源不统一导致了对同一个指标分析的结果不相同。为了解决该问题,Bell Inman提出了数据仓库的概念,其目的是为了分析和决策的需要,将相互分离的业务系统的数据源整合在一起,可以为领导和决策层提供分析和辅助决策。 3、国内企业对数据仓库建设认识的误区: 大家对数据仓库的认识是将业务系统的数据进行数据抽取、迁移和加载(ETL),将这些数据进行整合存放在一起,统一管理,需要什么样的分析就可提供什么样的分析,这就是数据仓库。这样做的结果是花了一年到两年的时间都无法将整个企业业务系统的数据整合在一起,花钱多、见效慢、风险大。一年后领导问起数据仓库项目时,回答往往是资金不足,人力不够,再投入一些资源、或者再延长半年的时间就会见到效果,但是往往半年过后还是仅仅可以看到十几张或者几十张报表。领导不满意,项目负责人压力也很大,无法交待。这时,项目经理或者项目负责人才意识到,项目有问题,但是谁也不敢说项目有问题,因为这样显然是自己当时的决策失误。怎么办?寻找咨询公司或者一些大的厂商,答案往往是数据仓库缺乏数据模型,应该考虑数据模型。如果建设时考虑到整个企业的数据模型,就可以建设成企业级的数据仓库(EDW。什么是数据模型,就是满足整 个企业分析要求的所有数据源。结果会如何,我个人认为:这样做企业级数据仓

数据仓库实例

计算机
王莹

本例采用的是SQl Server2005所提供的商业智能服务和工 具,主要包括Analysis Services(分析服务), Integration Services(集成服务),Reporting Services(集成服务)和Bussiness Intelligence Developer Studio(BIDS)。

分析服务(Analysis Services) SQL Server 分析服务(SSAS)是一个用于分析数据仓库中数据的工 具,它包括了OLAP和数据挖掘工具。在SQL Server 2005数据库系统 中,Analysis Services工具以服务器的方式为用户提供管理多维数 据立方体的服务。Analysis Services可以把数据仓库中的数据组织 起来,经过预先的聚集运算,加入到多维立方体中(即建立立方 体),然后对复杂的分析型访问做出迅速的回答。

集成服务(Integration Services) SQL Server 集成服务(SSIS)被定位成一个能生成高性能数据集成解决 方案(包括数据仓库中数据的提取、转换和加载(ETL))的平台。其集 成的含义主要就是指把ETL集成在一起。SSIS通过一个统一的环境向用户 提供了数据转换服务(DTS)所能提供的所有功能,并且大大减少了用户 花在编写程序和脚本上的精力和时间。 SSIS的基本功能包括:
? ? ? ? ? ? 合并来自异类数据源中的数据 填充数据仓库和数据集市 整理数据和将数据标准化 精确和模糊的查找功能 将商业智能置入数据转换过程 使管理功能和数据加载自动化

(完整word版)建设数据仓库的八个步骤

大数据技术部 建设数据仓库的八个步骤2017年04月25日编制

建设数据仓库的八个步骤 摘要: 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题。 关键词:数据仓库元数据 建设数据仓库 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题,从数据源中抽取哪些数据。因此数据仓库的项目小组应该由业务人员和信息部门的人员共同组成,双方需要相互沟通,协作开发数据仓库。 开发数据仓库的过程包括以下几个步骤。 1.系统分析,确定主题 建立数据仓库的第一个步骤就是通过与业务部门的充分交流,了解建立数据仓库所要解决的问题的真正含义,确定各个主题下的查询分析要求。 业务人员往往会罗列出很多想解决的问题,信息部门的人员应该对这些问题进行分类汇总,确定数据仓库所实现的业务功能。一旦确定问题以后,信息部门的人员还需要确定一下几个因素: ·操作出现的频率,即业务部门每隔多长时间做一次查询分析。 ·在系统中需要保存多久的数据,是一年、两年还是五年、十年。 ·用户查询数据的主要方式,如在时间维度上是按照自然年,还是财政年。 ·用户所能接受的响应时间是多长、是几秒钟,还是几小时。

由于双方在理解上的差异,确定问题和了解问题可能是一个需要多次往复的过程,信息部门的人员可能需要做一些原型演示给业务部门的人员看,以最终确定系统将要实现的功能确实是业务部门所需要的。 2.选择满足数据仓库系统要求的软件平台 在数据仓库所要解决的问题确定后,第二个步骤就是选择合适的软件平台,包括数据库、建模工具、分析工具等。这里有许多因素要考虑,如系统对数据量、响应时间、分析功能的要求等,以下是一些公认的选择标准: ·厂商的背景和支持能力,能否提供全方位的技术支持和咨询服务。 ·数据库对大数据量(TB级)的支持能力。 ·数据库是否支持并行操作。 ·能否提供数据仓库的建模工具,是否支持对元数据的管理。 ·能否提供支持大数据量的数据加载、转换、传输工具(ETT)。 ·能否提供完整的决策支持工具集,满足数据仓库中各类用户的需要。 3.建立数据仓库的逻辑模型 具体步骤如下: (1)确定建立数据仓库逻辑模型的基本方法。 (2)基于主题视图,把主题视图中的数据定义转到逻辑数据模型中。 (3)识别主题之间的关系。

数据仓库建设方案详细

第1章数据仓库建设 1.1数据仓库总体架构 专家系统接收增购项目车辆TCMS或其他子系统通过车地通信传输的实时或离线数据,经过一系列综合诊断分析,以各种报表图形或信息推送的形式向用户展示分析结果。针对诊断出的车辆故障将给出专家建议处理措施,为车辆的故障根因修复提供必要的支持。 根据专家系统数据仓库建设目标,结合系统数据业务规,包括数据采集频率、数据采集量等相关因素,设计专家系统数据仓库架构如下: 数据仓库架构从层次结构上分为数据采集、数据存、数据分析、数据服务等几个方面的容: 数据采集:负责从各业务自系统中汇集信息数据,系统支撑Kafka、Storm、Flume

及传统的ETL采集工具。 数据存储:本系统提供Hdfs、Hbase及RDBMS相结合的存储模式,支持海量数据的分布式存储。 数据分析:数据仓库体系支持传统的OLAP分析及基于Spark常规机器学习算法。 数据服务总线:数据系统提供数据服务总线服务,实现对数据资源的统一管理和调度,并对外提供数据服务。 1.2数据采集 专家系统数据仓库数据采集包括两个部分容:外部数据汇集、部各层数据的提取与加载。外部数据汇集是指从TCMS、车载子系统等外部信息系统汇集数据到专家数据仓库的操作型存储层(ODS);部各层数据的提取与加载是指数据仓库各存储层间的数据提取、转换与加载。 1.2.1外部数据汇集 专家数据仓库数据源包括列车监控与检测系统(TCMS)、车载子系统等相关子系统,数据采集的容分为实时数据采集和定时数据采集两大类,实时数据采集主要对于各项检测指标数据;非实时采集包括日检修数据等。 根据项目信息汇集要求,列车指标信息采集具有采集数据量大,采集频率高的特点,考虑到系统后期的扩展,因此在数据数据采集方面,要求采集体系支持高吞吐量、高频率、海量数据采集,同时系统应该灵活可配置,可根据业务的需要进行灵活配置横向扩展。 本方案在数据采集架构采用Flume+Kafka+Storm的组合架构,采用Flume和ETL 工具作为Kafka的Producer,采用Storm作为Kafka的Consumer,Storm可实现对海量数据的实时处理,及时对问题指标进行预警。具体采集系统技术结构图如下:

基于数据仓库的OLAP技术探究

基于数据仓库的OLAP技术探究 【摘要】在科学技术日渐趋于数字化的发展背景下,数据处理技术已经成为了促进社会科技发展的主要动力,随着数据处理技术在企业中的应用的迅速推广,其为企业运营带来的效益也在日渐突显,数字处理技术能够在数据积累的基础上高效率的完成数据筛选和分类处理,而这正是企业在运营生产和业务数据处理中必不可少的。数据处理技术水平的迅速提升,使得数据的联机分析与处理成为可能,OLAP数据联机处理技术逐渐成为当代企业数据仓库管理的核心技术。本文从OLAP概念角度出发,对该技术的数据存储和处理机制进行分析,进一步强调了OLAP技术在数据处理中的重要作用,并对该技术中囊括的数据库ROLAP技术和数据分析技术等加以简要论述。 【关键词】数据仓库;OLAP技术;数据ROLAP技术 1 数据仓库概念及其体系结构分析 1.1 数据仓库定义分析 数据仓库的本质是由联机分析系统和决策支持系统共同构成的结构化数据环境,是一个具有稳定性和集成性,能够面向发展主题的数据集合,并通过数据的分布管理和并行处理以支持企业集体管理过程中的决策。数据仓库的建立为企业的决策处理提供了更为有力的支持,其数据并行处理的多变性也使得数据仓库能够在不同的数据环境中对大量的数据信息进行有效的处理。在数据仓库的实际应用中,高层次的数据归类标准能够使数据在宏观上得到类型划分,不同类型的数据在依照各自归属领域中逻辑处理后,经集成和加工后变为面向主题的数据集合,并为之后的数据调取做好准备。 1.2 数据仓库的体系结构划分 数据仓库在数据处理过程中主要分为数据的分析型处理和操作型处理,两种数据处理方式在实际应用中通常区别使用,以保证数据仓库中数据结构的整体性。为进一步完善数据仓库的体系结构,通常将数据仓库的体系结构划分为数据查询和分析组件,数据集成组件,数据源和监视器等体系结构。数据查询和分析组件能够将数据仓库的终端用户数据信息转换为数据源装入DW,并在数据集成组件的DW视图维护中完成数据源的合并及过滤。数据源作为一个数据库系统,主要包括HTML类型文件和SGML类型文件等,数据仓库的内容通过监视器与多类型文件相连接,以实现数据仓库中数据源的监测与处理。随着数据仓库在实际应用中的日渐完善,其体系结构的划分也更为具体化,数据提取工具,转换工具以及其他多种数据处理工具的协调使用使得数据仓库日渐成为数据处理系统的核心,并以此为基础满足用户的多方面数据需求。 2 数据联机分析处理技术发展背景讨论

建设数据仓库7个步骤

成功实施数据仓库项目的七个步骤 建立一个数据仓库并不是一个简单的任务,不应该由一个人单独完成。由于数据仓库最佳结合了业务惯例和信息系统技术,因此,一个成功的数据仓库实施需要这两方面的不断协调,以均衡其所有的需要,要求,任务和成果。我很乐意与大家分享我在规划和管理任何数据库项目时采用的方法,这些数据库包括交易数据库,数据仓库,和混合型数据库。由于我生活在关系数据库和数据仓库以及用以支撑它们的数据提取,转换和加载(ETL )过程中,所以我会集中在这些领域讨论我的方法。然而,您可以将这些方法扩展到整个栈--OLAP立方体和如报告,特征分析(ad-hoc analysis),记分卡和仪表盘展示之类的信息传递应用。 我不是吃撑了要告诉一个真正的项目经理( PM )如何做他或她的工作,相反,我写的这些是为那些数据库管理员和开发者,他们没有好运气能与有经验的项目经理一起工作;同样也适合这样的IT专业人员,他们被突然要求:“建立一个数据仓库“,并且需要自己扮演项目经理的角色。我的讨论不会是完整的,但我希望这会给您足够的信息来让您的项目球滚起来。 如图1所示,数据仓库项目有3个轨道(tracks):数据轨道,技术轨道和应用层轨道。当您在整理任何数据库项目计划时,我建议您以这三个轨道为模板来管理和同步您的活动。当您向技术决策者( TDMs ) ,商业决策者( BDMs ) ,和所有其他该数据仓库项目参与者讲解您的计划时,您也可以把图1当作一个高级的概要图来使用。 使用一种生命周期管理方法 我鼓励您利用您的组织可以提供的资源,比如设计,开发和部署系统和软件的技术和方法。如果贵公司对于这些工作没有采用任何正式的方法,继续前进吧,您可采用我为我自己的数据库项目开发的7D数据库生

国内外有哪些公司提供数据仓库解决方案

甲骨文公司数据仓库解决方案详叙 作者邬凡 系别商务学院 专业物流管理 年级10级 学号102067229 评定教师张宏伟

甲骨文公司数据仓库解决方案详叙 一、.数据仓库发展的商业驱动力 (一)、企业生存环境的变化 在信息时代,伴随着Internet技术的蓬勃发展,全世界范围内的各个企业都在经历一场深刻的变革,各企业都在利用Web无所不达的特性来扩展自己将商品和服务推向市场的能力,但同时由于Internet的存在,客户的期望也是水涨船高。客户需要即时访问各类信息,并不断比较您和您的竞争对手的情况。因此,在Internet 时代,谁能在正确的时间以正确的价格交付正确的产品,谁就是赢家。那么,企业在扩大市场、提高效率和保持客户的原始商业驱动力不变的情况下,如何继续保持竞争的优势,它关系到企业在未来的发展命运。有远见的公司都会意识到,只有将自己建成能够对客户做出迅速反应的公司才能获得诸多收获,这些收获包括收入、新客户、客户满意度、客户回头率以及公司效益的增加,从而使竞争力大为提升。 在80年代中期及90年代初,许多企业开始重新设计其商业流程,以期降低成本并提高效率和竞争能力。同时,这些企业也意识到,要达到这些目的,所需要开发的技术耗资巨大、复杂且耗时冗长。因此,许多公司转而求助于企业资源规划(ERP)应用系统。这些应用系统帮助它们实现了内部商业流程,如财务、制造、库存管理和人力资源的自动化和优化,从而将企业从战术性的日常商业运作事务中解放了出来。

自此以后,企业关注的焦点逐渐由改进内部运作转移到更多地关注客户上来。各类人士和商业机构都开始要求得到更多的关注和更及时的服务,许多公司都开始调整自己的商业模式,并将更多的注意力投向外部。由于需要将更多的注意力集中到客户身上,许多企业都再度开始寻求技术的帮助,即求助于客户关系管理(Customer Relationship Management)软件。和ERP一样,CRM解决方案着力于提高企业运作的自动化和改进业务处理流程,建立客户关系管理(CRM)系统的目的是赋予企业更完善的与客户交流的能力,即从潜在客户识别、生成有需求的客户,到销售完结、付运订单以及不断进行的服务和支持,提供全过程的自动化处理和更好的协调与合作,以提高客户满意度和客户忠实度,增加市场机会和销售利润,为企业发展服务。 通过不断采用新的技术手段,推出新的业务模式,企业的发展规模在不断的扩大,企业所积累的信息(包括企业内部业务数据和客户相关数据)越来越多,如何充分利用这些信息,为企业的进一步发展服务,已经成为企业急需解决的一个关键问题。 1、企业如何迎接市场变化带来的挑战 “Internet的发展正在改变我们人类生活的方方面面”,对于企业经营的挑战主要来自三个方面: 如何把握急速扩张的市场机会(Expand Markets):市场竞争的全球化日趋激烈,传统的商业界限正在逐步消失,新的业务模式层出不穷,如何抓住机会,占领更多的市场份额。

数据仓库建设方案84099

1.数据仓库概述 经过多年IT的建设,信息对于XXX 的日常管理已经日益重要,并逐渐成为重要的信息资产,信息资产的管理已经成为日常管理中一个非常重要的环节。如何管理和利用好XXX 内部纷繁的数据也越来越成为信息管理的一项重要工作。 在过去相当一段时间内,XXX 业务系统的构建主要围绕着业务的数据展开,应用的构建多是自下而上构建,主要以满足某个部门的业务功能为主,我们称之为业务处理的时代。这样的构建方式造成了一个个分立的应用,分立的应用导致了一个个的静态竖井。由于数据从属于应用,缺乏XXX 全局的单一视图,形成了一个个信息孤岛,分立的系统之间缺乏沟通,同样数据的孤岛导致只能获得片面的信息,而不是全局的单一视图。存储这些信息的载体可能是各种异构或同构的关系型数据库,也有可能是XML 、EXCEL 等文件。因此,构建新一代的一体化平台提上了日程并最终促成全域数据的管理方式,目的是覆盖XXX 各个环节的关键业务数据,完善元数据管理,形成全局的数据字典、业务数据规范和统一的业务指标含义,能够灵活的获取XXX 业务数据的单一视图(需要保证数据的一致性、完整性、准确性和及时性)。数据的交换和共享主要发生在上下级组织机构之间或同级的不同部门之间。最终,这些数据可以为部队分析、决策支持(多维分析、即席查询、数据挖掘)等应用提供更及时、准确、有效的支持。 数据仓库的目标是实现跨系统数据共享,解决信息孤岛,提升数据质量,辅助决策分析,提供统一的数据服务。同时,数据仓库的构建也面临着各种挑战,比如信息整合在技术上的复杂度、信息整合的管理成本、数据资源的获取、信息整合的实施周期以及整合项目的风险等。

企业数据仓库概要设计说明书

XXXX企业数据仓库概要设计说明书 (文档编码:OM-BIDW-C001)(版本01.00.000) 未经许可,不得以任何形式抄袭 XXXX企业版权所有,翻板必究 XXXX企业数据组 2009年3月

文档变更历史

目录 1前言 (3) 2术语 (3) 3系统环境及功能 (4) 4系统数据流 (6) 5系统内部功能框架 (7) 5.1 数据源层(Data Source) (8) 5.1.1 描述 (8) 5.1.2 目标 (8) 5.2 数据装载层(ETL) (8) 5.2.1 描述 (8) 5.2.2 目标 (8) 5.3 假定与约束 (9) 5.4 数据仓库层(ODS、EDS、DM) (9) 5.4.1 描述 (9) 5.4.2 目标 (9) 5.4.3 假定与约束 (10) 5.4.4 系统模块(System Build Blocks) (11) 5.5 前端展现层(Client Access) (12) 5.5.1 描述 (12) 5.5.2 目标 (12) 5.5.3 假定与约束 (12) 5.5.4 需要的技能 (12) 5.5.5 待确定问题 (13) 5.6 元数据管理(MetaData Management) (13) 5.6.1 描述 (13) 5.6.2 目标 (13) 5.6.3 假定与约束 (14) 5.6.4 需要的技能 (14) 5.7 调度监控系统(Dispatch Supervisor System) (14) 5.7.1 描述 (14) 5.7.2 目标 (14) 5.7.3 假定与约束 (15) 5.7.4 (15)

ETL构建企业级数据仓库五步法

ETL构建企业级数据仓库五步法 在数据仓库构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线,包括了从数据清洗,整合,到转换,加载等的各个过程,如果说数据仓库是一座大厦,那么ETL就是大厦的根基,ETL抽取整合数据的好坏直接影响到最终的结果展现。所以ETL在整个数据仓库项目中起着十分关键的作用,必须摆到十分重要的位置。 一、什么是ETL ETL是数据抽取(Extract)、转换(Transform)、加载(Load)的简写,它是将OLTP 系统中的数据经过抽取,并将不同数据源的数据进行转换、整合,得出一致性的数据,然后加载到数据仓库中。简而言之ETL是完成从OLTP系统到OLAP系统的过程(图一:pic1.jpg)。 二、数据仓库的架构 数据仓库(Data Warehouse \ DW)是基于OLTP系统的数据源,为了便于多维分析和多角度展现将其数据按特定的模式进行存储而建立的关系型数据库,它不同于多维数据库,数据仓库中的数据是细节的,集成的,数据仓库是面向主题的,是以OLAP系统为分析目的。它包括星型架构(图二:pic2.jpg)与雪花型架构(图三:pic3.jpg),其中星型架构中间为事实表,四周为维度表,类似星星;雪花型架构中间为事实表,两边的维度表可以再有其关联子表,而在星型中只允许一张表作为维度表与事实表关联,雪花型一维度可以有多张表,而星型不可以。考虑到效率时,星型聚合快,效率高,不过雪花型结构明确,便于与OLTP系统交互。在实际项目中,我们将综合运用星型架构与雪花型架构。 三、ETL构建企业级数据仓库五步法的流程 (一)、确定主题 即确定数据分析或前端展现的某一方面的分析主题,例如我们分析某年某月某一地区的啤酒销售情况,就是一个主题。主题要体现某一方面的各分析角度(维度)和统计数值型数据(量度),确定主题时要综合考虑,一个主题在数据仓库中即为一个数据集市,数据集市体现了某一方面的信息,多个数据集市构成了数据仓库。 (二)、确定量度 在确定了主题以后,我们将考虑要分析的技术指标,诸如年销售额此类,一般为数值型数据,或者将该数据汇总,或者将该数据取次数,独立次数或取最大最小值等,这样的数据称之为量度。量度是要统计的指标,必须事先选择恰当,基于不同的量度可以进行复杂关键性能指标(KPI)等的计算。 (三)、确定事实数据粒度 在确定了量度之后我们要考虑到该量度的汇总情况和不同维度下量度的聚合情况,考虑到量度的聚合程度不同,我们将采用“最小粒度原则”,即将量度的粒度设置到最小,例如我们将按照时间对销售额进行汇总,目前的数据最小记录到天,即数据库中记录了每天的交易额,那么我们不能在ETL时将数据进行按月或年汇总,需要保持到天,以便于后续对天进行分析。而且我们不必担心数据量和数据没有提前汇总带来的问题,因为在后续的建立CUBE时已经将数据提前汇总了。 (四)、确定维度 维度是要分析的各个角度,例如我们希望按照时间,或者按照地区,或者按照产品进行分析,那么这里的时间、地区、产品就是相应的维度,基于不同的维度我们可以看到各量度的汇总情况,我们可以基于所有的维度进行交叉分析。这里我们首先要确定维度的层次(Hierarchy)和级别(Level)(图四:pic4.jpg),维度的层次是指该维度的所有级别,包括各级别的属性;维度的级别是指该维度下的成员,例如当建立地区维度时我们将地区维度

基于数据仓库快速实现业务价值

1基于数据仓库快速实现业务价值 1.1基于经济资本的绩效考核 绩效考核是银行经营治理重要的风向仪和导向器。银行能够依照企业资信等因素对各项业务、产品分不设定风险系数或权重,对各项资产进行风险计量,并测算各分支行的经济资本占用额,核算经济资本增加值,从而计算经济资本回报率。然后,将经济资本回报率与其业务费用、工资奖励进行挂钩考核。同时,设定目标经济资本回报率,对实际回报率较低的机构减少经济资本配置,促使其调整资产业务结构。 经营业绩考核系统实际上是贯穿银行实行价值治理的两个核心机制,一个是以经济资本为核心的风险和效益约束机制,另一个是以经济增加值为核心的绩效评价和激励机制。 1.1.1新的绩效考核渐行渐近 绩效考核不仅是银行对一定时期经营治理状况和战略执行的检验和价值推断,同时其制度设计本身也反映了银行在特定时期的经营进展理念。我国商业银行正在从追求规模最大化的“跑马圈地”向平衡风险与利润的“价值最大化”的经营模式转变,因此,其绩效考核体制总体上也呈现出从过去的以利润最大化为核心的盈利能力考核,逐步转变为以价值治理为核心的综合效益考

核,即从治理利润提升到治理价值。 以治理利润为指向的绩效考核,核心任务是规模的扩张或既定规模下的利润最大化,从投入/产出角度分析,要紧实现对产出水平的结果考核; 以治理价值为指向的绩效考核,核心任务是在合理运用资本的基础上,通过调整各部门、各业务、产品、客户等内部结构的投入/产出关系,实现整体的价值最大化。这种绩效考核方法更关注与银行的资本结构的合理配置,提高银行的利润率。 以经济资本为核心的绩效考核起点较高,建设的难度较大,需要专业的实施团队参与,表现在以下几个方面: a)经济资本的计量复杂。现在国内普遍采纳系数法计算, 也确实是Basel II中的差不多法,这种方法的关键在 于需要制定大量的系数,系数的准确性要求专门高, 我们建议采纳进一步细化系数类不的方法,从区域、 行业、产品、客户等不同维度细化经济资本系数。 b)经济增加值计算的准确性。经济增加值的计确实是盈 利减去经济资本的最低回报率,最低资本回报率一般 采纳市场的拆借利率或者长期国债利率等,这种方法 比实际值低,有待进一步提高。我们建议在绩效考核

成功实施数据仓库项目的7个步骤

成功实施数据仓库项目的7个步骤 建立一个数据仓库并不是一个简单的任务,不应该由一个人单独完成。由于数据仓库最佳结合了业务惯例和信息系统技术,因此,一个成功的数据仓库实施需要这两方面的不断协调,以均衡其所有的需要,要求,任务和成果。我很乐意与大家分享我在规划和管理任何数据库项目时采用的方法,这些数据库包括交易数据库,数据仓库,和混合型数据库。由于我生活在关系数据库和数据仓库以及用以支撑它们的数据提取,转换和加载(ETL )过程中,所以我会集中在这些领域讨论我的方法。然而,您可以将这些方法扩展到整个栈--OLAP立方体和如报告,特征分析(ad-hoc analysis),记分卡和仪表盘展示之类的信息传递应用。 我不是吃撑了要告诉一个真正的项目经理( PM )如何做他或她的工作,相反,我写的这些是为那些数据库管理员和开发者,他们没有好运气能与有经验的项目经理一起工作;同样也适合这样的IT专业人员,他们被突然要求:“建立一个数据仓库“,并且需要自己扮演项目经理的角色。我的讨论不会是完整的,但我希望这会给您足够的信息来让您的项目球滚起来。

如图1所示,数据仓库项目有3个轨道(tracks):数据轨道,技术轨道和应用层轨道。当您在整理任何数据库项目计划时,我建议您以这三个轨道为模板来管理和同步您的活动。当您向技术决策者( TDMs ) ,商业决策者( BDMs ) ,和所有其他该数据仓库项目参与者讲解您的计划时,您也可以把图1当作一个高级的概要图来使用。 使用一种生命周期管理方法 我鼓励您利用您的组织可以提供的资源,比如设计,开发和部署系统和软件的技术和方法。如果贵公司对于这些工作没有采用任何正式的方法,继续前进吧,您可采用我为我自己的数据库项目开发的7D数据库生命周期管理方法(Discover, Design, Develop, Deploy, Day to Day , Defend, Decommission), 昵称“7D法”。 我的“7D”数据库生命周期管理方法讲的是数据库的生命周期管理,而不是相关的软件(应用程序)和硬件的生命周期。图1包括了软硬件轨道,但我不会进一步阐述它们的管理。为了成功实施数据库生命周期的方法,有必要调整和同步数据库生命周期的里程碑、硬件和应用软件。

企业数据仓库概要设计说明书-ETL概要设计分册

XXXX企业数据仓库概要设计说明书ETL概要设计分册 (文档编码:OM-BIDW-C008) (版本01.00.000) 未经许可,不得以任何形式抄袭 XXXX版权所有,翻板必究 OM数据仓库XXXX企业数据组 2009年3月

文档变更历史

目录 1概述 (4) 2设计原则和前提 (5) 2.1 整体部署 (5) 2.2 前提条件 (6) 2.3 设计原则 (6) 3整体框架 (7) 3.1 ETL系统架构图 (7) 3.2 ETL系统功能模块描述 (7) 4数据抽取模块 (9) 4.1 假设与约定 (9) 4.2 模块功能图 (9) 4.3 各子模块功能及处理流程 (11) 5数据加载模块 (11) 5.1 假设与约定 (11) 5.2 数据加载模块图 (11) 5.3 数据加载功能模块描述 (12) 6作业调度模块 (13) 6.1 模块概述 (13) 6.2 假设与约定 (13) 6.3 作业调度流程 (13) 6.4 ETL作业种类及调度实现方法 (14) 7监控管理模块 (15) 7.1 监控管理模块图 (15) ETL监控内容 (16) 附录1控制表及控制文件设计 (16) 附录2:文件目录及编码说明 (19)

1概述 ETL是数据仓库系统开发中至关重要的一个过程,它涉及到对源数据的抽取、整合及各种转换,并最终形成面向用户的分析数据。由于数据仓库系统的数据源来自于多个分散的业务系统,对不同业务系统的数据整合及清洗转换将是一个复杂的过程,ETL过程决定了数据仓库系统获取数据的准确性。 另外由于ETL包括数据抽取、数据清洗、数据转换及数据加载等数据处理过程,这些处理过程分散在不同的系统平台及开发工具上,对这些作业过程的统一调度将是一个重要的问题,作业调度涉及到系统的稳定性。

数据仓库成功应用案例讨论

中国银行广东分行数据仓库成功应用案例 信用卡业务是商业银行业务中非常重要的一部分,中国的商业银行开展信用卡业务已多年,相关数据积累相对完备且真实,信用卡业务的经营运作也已从简单的扩大规模、以量取胜阶段进入到成熟竞争、以质取胜阶段,各商业银行不断推出新的服务品种和花样繁多的增值服务,提高市场占有率并强化品牌意识以获得利润。 中国加入WTO后,银行卡业务将在3至5年内对外资银行开放,而银行卡业务不依赖于分支机构的特点将使中国的商业银行信用卡业务面临更加严酷的竞争。信用卡业务竞争本质上就是客户的竞争,而且是优质客户的竞争。针对客户发现、客户提升、客户保持、市场细分、忠诚度、贡献度、个性化服务乃至个人信用风险等等一系列围绕客户关系的新问题,支持日常运作的信用卡生产系统是面向柜员和交易的日常营运和客户服务基础设施,无法提供众多分析、决策型用户对大量历史数据同时进行突发的、复杂的决策分析,而建立一套以客户为中心的信用卡业务分析系统则是实现上述命题的必要可行手段。 在这种情况下,中国银行广东分行引入了海波龙的Hyperion Intelligence,希望通过利用Hyperion Intelligence应用实现这样的目标:建立一套以客户为中心的信用卡业务分析系统,方便企业各级工作人员获取各类信息,实现对成本收益、风险控制、绩效评估、客户管理、营销战役等决策目标的支持,并达到风险管理和控制、客户关系管理与个性化服务、商户分析与市场策略、费用控制与利润分析四大应用目标。 成功典范 中国银行广东省分行是国内金融界最早成功实施数据仓库应用解决方案的单位,其在1996年投产的省市两级金融管理信息系统(FMIS)因首次采用并成功实施先进的数据仓库/OLAP技术而荣获“八五”国家科技攻关重大成果奖,并成为目前业界反复引用的典型成功案例。 在随后的数年中,中国银行广东省分行在决策支持/数据仓库应用研发方面的投入一直保持相当大的力度,陆续推出数项新的应用,应用领域也从最初的财务管理、资产负债指标监控等分析主题逐步延伸至目前的客户及消费行为分析、个人信用评估、授信风险监控、客户关系管理以及一对一个性化营销等分析主题。 广东华际友天信息科技有限公司和中国银行广东省分行共同实施的信用卡分析系统采用了Hyperion和IBM在业界领先的数据仓库技术和工具,专门针对信用卡业务的商业智能应用。此系统的研制目的是为与信用卡业务有关各级管理人员、统计分析人员、风险监控人员,特别是业务发展人员提供灵活有效的实时数据分析/决策支持环境,使他们能够便捷地获得并分析客户特征信息、各交易要素信息以及市场统计信息,从而支持成本收益、风险控制、绩效评估、客户管理、营销战役等决策目标的实现。

数据仓库在现代企业中的应用

数据仓库在现代企业中的应用 【摘要】当今世界,随着科学技术的发展,数据的迅速增长,信息量的急剧增加,给人类提出了一个亟待解决的课题,即如何有效地使用这些数据。目前还处于数据丰富而知识贫乏阶段,利用当前的数据库技术并不能充分发挥这些数据的作用。本文介绍了数据仓库技术,分析了数据仓库技术对于现代企业的作用,给出了在企业中建立数据仓库的方法和实施步骤,同时介绍了市场上一些成熟的数据仓库解决方案。 【关键词】数据库数据仓库联机分析 企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础的。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个巨大的工程。 一、对数据仓库的简介 1、什么是数据仓库。数据仓库的概念由美国著名工程学家W·H·lnmon博士于90年代在《建立数据仓库》一书中提出:“数据仓库(Data Warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持经营管理中的决策制定过程。”主题是指用户使用数据仓库进行决策时所关心的重点方面;面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息;集成是指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是经过系统加工、汇总和整理,保证数据仓库内的信息是关于整个企业的全局信息;稳定是指一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的插入和查询操作,但修改和删除操作很少;包含历史数据是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点到目前各个阶段的信息,通过这些信息可以对企业的发展历程和未来趋势做定量分析和预测。作为一个系统,数据仓库至少包含三个基本功能部分。 第一,数据获取。它负责从外部数据源获取数据,包括从各现行系统获取当前细节数据和从其他存储介质获取早期细节数据,数据被区分出来后,进行拷贝或格式转换等处理,准备载入仓库;第二,数据存储与管理。这部分负责仓库内部的维护和管理,提供的服务包括数据存储的组织、数据的维护、数据的分发、仓库的例行维护等;第三,信息访问。信息访问部分属于数据仓库的前端,面向不同种类的最终用户,主要由桌面系统的各种工具组成。数据仓库的最终用户在这里提取信息、分析数据集、实施决策等。进行信息访问的软件工具主要是查询生成工具、多维分析工具和数据采掘工具等。

数据仓库设计的21条原则

数据仓库设计的21条原则:7个步骤,7个禁忌和7种思路(转) 高效实现数据仓库的七个步骤 数据仓库和我们常见的RDBMS系统有些亲缘关系,但它又有所不同。如果你没有实施过数据仓库,那么从设定目标到给出设计,从创建数据结构到编写数据分析程序,再到面对挑剔的用户的评估,整个过程都会带给你一种与以往的项目完全不同的体验。一句话,如果你试图以旧有的方式创建数据仓库,那你所面对的不是预算超支就是所建立的数据仓库无法良好运作。 在处理一个数据仓库项目时需要注意的问题很多,但同时也有很多有建设性的参考可以帮助你更顺利的完成任务。开放思维,不断尝试新的途径,对于找到一种可行的数据仓库实现方法来说也是必需的。 1. 配备一个全职的项目经理或你自己全面负责项目管理 在通常情况下,项目经理都会同时负责多个项目的实施。这么做完全是出于资金和IT资源方面的考虑。但是对于数据仓库项目的管理,绝对不能出现一人身兼数个项目的情况。由于你所处的领域是你和你的团队之前没有进入过的领域,有关数据仓库的一切-数据分析、设计、编程、测试、修改、维护-全都是崭新的,因此你或者你指派的项目经理如果能全心投入,对于项目的成功会有很大帮助。 2. 将项目管理职责推给别的项目经理 由于数据仓库实现过程实在是太困难了,为了避免自虐,你可以在当前阶段的项目完成后就将项目管理职责推给别的项目经理。当然,这个新的项目经理一定要复合第一条所说的具有全职性。为什么要这么做呢?首先,从项目经理的角度看,数据仓库实施过程的任何一个阶段都足以让人身心疲惫。从物理存储设备的开发到Extract-Transform-Load的实现,从设计开发模型到OLAP,所有阶段都明显的比以前接触的项目更加困难。每个阶段不但需要新的处理方法、新的管理方法,还需要创新性的观点。所以将管理职责推给别的项目经理不但不会对项目有损害,还可以起到帮助作用。 3.与用户进行沟通 这里所讲的内容远比一篇文章本身要重要的多。你必须明白,在数据仓库的设计阶段,那些潜在用户自己也不清楚他们到底需要数据仓库为他们做什么。他们在不断的探索和发现自己的需求,而你的开发团队也在和客户的接触中做着同样的事情。更加频繁的与客户接触,多做记录,并让你的团队更关注于项目需求讨论的结果而不是讨论的过程本身。 既然你和客户的交流是为了了解存储的数据是何种类型以及如何有效存储数据,你也许需要(和你的用户一起)采用一种新的方法观察数据,而不是直接处理数据。你可以尝试从中找出隐藏的信息,比如在一段时期内的数字涨落等。不要试图追寻项目需求的答案,而是要让答案找上门来。 4. 以技术/信息库作为领导 由于数据仓库实施的各个阶段都有很大不同,因此你需要有人能起到维持整个项目的连续进行的作用,不过这个职责并不需要那种全职性。项目实施有三个重要方面:架构、技术和业务。将架构作为重点可以保证在整个项目中,数据仓库的架构从物理层往上,都会受到良好的维护。而我们应该将技术作为重点,因为开发团队和关键用户都在使用他们以前从未用过的工具,必须有人监督开发过程以及工具使用的一致性。 最后,在数据仓库的应用过程中浮现出来的业务需求必须被详细分析和记录,以促机开发过程持续下去。如果用户不能很好的与开发人员以及其它用户沟通,那么数据分析和度量方面的开发进程就会延期,所以必须有人关注业务方面的开发,推动开发进入更高级别。 5. 跳出反复修改程序的陷阱 第一次实现的数据仓库肯定不会是最终交付的版本。为什么呢?实际上在真正见到产品前,你无法确定

数据仓库建设的几点建议培训资料

数据仓库建设的几点 建议

北京甲骨文软件有限公司咨询经理鲁百年博士 一、国内信息化的现状 1、信息化建设的发展历史: 在国内信息化建设过程中,基本上是按照当时业务系统的需求进行建设,例如:在一个企业中,财务部门为了减少工资发放的差错,提高发放的效率,先建设一个工资发放和管理程序;为了报账和核对的需求,建设一个财务管理程序;在银行首先为了业务处理的方便,将最基本的手工记帐和处理的业务建成一个系统,过一段时间,如果有新的业务推出,就再建设一个新的系统,或在原系统的基础上增加新的业务处理。这样的结果使每个系统和系统之间缺少真正的信息沟通和信息交换。 2、为何要建立数据仓库: 前面我们讲过,业务系统各自为政,相互独立。当很多业务系统建立后,由于领导的要求和决策的需求,需要一些指标的分析,在相应的业务系统基础上再增加分析和相应的报表功能,这样每个系统就增加了报表和分析功能。但是,由于数据源不统一导致了对同一个指标分析的结果不相同。为了解决该问题,Bell Inman提出了数据仓库的概念,其目的是为了分析和决策的需要,将相互分离的业务系统的数据源整合在一起,可以为领导和决策层提供分析和辅助决策。 3、国内企业对数据仓库建设认识的误区: 大家对数据仓库的认识是将业务系统的数据进行数据抽取、迁移和加载(ETL),将这些数据进行整合存放在一起,统一管理,需要什么样的分析就可提供什么样的分析,这就是数据仓库。这样做的结果是花了一年到两年的时间都无法将整个企业业务系统的数据整合在一起,花钱多、见效慢、风险大。一年后领导问起数据仓库项目时,回答往往是资金不足,人力不够,再投入一些资源、或者再延长半年的时间就会见到效果,但是往往半年过后还是仅仅可以

数据仓库系统建设方案详细

河北省工商银行 数据仓库系统建设方案 建 议 书

北京世纪明日网络科技有限公司 二零零零年三月 河北省工商银行数据仓库系统建设方案 目录 第一章前言 1.1数据仓库发展史 1.2竞争日趋激烈的金融市场 1.3中国专业银行面临的挑战 1.4中国专业银行实施数据仓库的意义 1.5中国专业银行实施数据仓库已具备的条件 第二章数据仓库总体概述 2.1 数据仓库基础 2.2 数据仓库技术概述 2.3 一个可扩展数据仓库的基本框架

2.4 一个数据仓库实施流程 第三章系统体系结构设计 3.1系统设计指导思想 3.2 方案总体框架图 3.3 系统体系结构设计 3.4 系统方案的组成 第四章银行数据仓库的建设 4.1 面向应用的OLTP系统和面向主题的OLAP系统 4.2 个性化服务的定义 4.3 业务探索/业务发掘 4.4 建立市场客户信息基础 4.5 利用数据仓库实现的基本模块 4.6 更高层次的开发应用 4.7 综合信息发布 第五章方案实施建议 5.1 开发模式 5.2 组织机构 5.3 项目实施进程

5.4 项目进度计划 第六章产品报价 6.1 软件产品报价 6.2 硬件产品报价 6.3 项目开发实施费用 第一章前言 1.1 数据仓库发展史 相对于许多行业而言,信息处理技术还是一门新兴的技术,但是其发展速度却几乎是最快的。随着计算机硬件技术的飞速发展,软件技术也是日新月异。 许多企业和机构已经建立了相对完善的OLTP(联机事物处理)系统。随着时间的推移,这些系统中积累了大量的历史数据,其中蕴含了许多重要的信息。通过对这些历史数据的分析和综合处理,可以找到那些对企业发展至关重要的业务信息,从而帮助有关主管和业务部门作出更加合理的决策。70年代中期出现的MIS(管理信息系统)实际上就是在这种背景下产生的。 但MIS具有极大的局限性。首先,它是按预先定义好的流程对数

数据仓库在我国企业的应用现状及实施策略分析

广西科学院学报 2006,22(4):375~377 Journal of GuangxiA cade m y of Sciences V ol .22,N o .4 N ove m ber 2006收稿日期:2006209212 作者简介:何朝红(19652),女,广西南宁人,硕士,主要从事供应链管理和物流信息化研究。 数据仓库在我国企业的应用现状及实施策略分析 On the Appl i ca ti on of Da t a W arehouses i n Ch i n ese En -terpr ises 何朝红 H E Chao 2hong (广西物资集团总公司,广西南宁 530022) (Guangx iM aterials Group Corp .,N ann ing ,Guangxi ,530022,Ch ina ) 摘要:分析数据仓库在我国企业中的应用现状。认为目前我国企业数据仓库的应用主要存在对数据仓库的概念理解不深,对项目的长期性、艰巨性认识不足,数据库系统中数据的积累不够,用户没有参与数据仓库建设的需求分析,项目实施过程中的管理混乱,具体实现中的技术问题尚未完善等问题。企业应从确定建立数据仓库的合适时机,选择切合实际的实施方法,取得最高管理层的支持和认可,确定基本目标、量化预期收益,选择正确的设计思路,选择合适的合作伙伴等6个方面应用数据仓库技术。关键词:数据仓库 应用 问题 策略 中图法分类号:T P 311113 文献标识码:A 文章编号:100227378(2006)0420375203 Abstract :T he app licati on of data w arehouses in Ch inese enterp rises is discussed .T he p roble m s in the app licati on are revealed as fo ll ow s .T he data w arehouse can not be fully understood .T he l ong ter m and hardness of the p roject runn ing are neglected .T here are less data accum ulated in the data w arehouse .T here is lack of users partici pating in the de m and analysis of the data w are 2house establishm ent ,and poor m anage m ent in the i m p le m entati on of the p ro ject .T he technical p roble m s have not been i m p roved in the operati on of the data w arehouse .T he relevant sugges 2ti ons are p resented .For the p roject to be supported ,it needs to choose a correct ti m e and a p rag 2m atic executi on w ay to construct a p ro ject ,set up an essential goal ,m easure the expecting bene 2fits ,and select a suitable partner . Key words :data w arehouse ,app licati on ,p roble m s ,strategy 近年来,计算机网络和数据库技术的迅速发展和广泛应用,使得企业管理进入了一个崭新的时代,企业的许多业务得到了联机事务处理(OL T P )信息系统的支持。然而,随着市场竞争的加剧,正确及时的决策成为企业生存和发展的重要环节。特别是随着数据库系统的逐日运行,产生了大量的业务数据,如何安全有效地存储和管理这些数据,并从大量繁杂的数据中获取其中有用的决策信息,为高层管理人员提供快速、准确和方便的决策支持,成为目前企业提高管理水平和竞争优势必须解决的问题。数据仓库(D ata W arehouse )技术的产生和发展,为这个问题的解决提供了有效的理论和方法指导。 数据仓库是20世纪90年代初出现的数据管理的 新技术,到20世纪90年代中期已在发达国家的许多行业中得到应用[1]。建立数据仓库的目的,就是把来自企业内部和外部的大量异构数据按辅助决策主题的要求进行加工、集成,为高层管理人员提供各种类型的、有效的数据分析,起到决策支持的作用。因此,数据仓库已经成为继Internet 之后的又一技术热点。 1 数据仓库在我国企业的应用现状 随着各种计算机技术,如数据模型、数据库技术和应用开发技术的不断发展,数据仓库技术也在不断完善,并在实际应用中发挥了越来越大的作用。据美国国际数据公司(I D C )调查,使用数据仓库技术的投资回报率(RO I )平均超过400%,平均回报时间 为2~3年;若从部门级数据仓库(也称“数据集市”)开始实施,则投资回报率平均超过500%[2]。 目前,在美国,30%到40%的公司已经或正在建

相关主题