根据Informix数据仓库系统实施方法学,我们可以将数据仓库的实施分为以下几个步骤:
1.业务需求分析
业务需求分析是数据仓库建设的基础,应该同用户进行充分沟通,了解用户的真实需求,避免理解的误差,同时,应该界定好项目开发范围。
在此阶段,主要工作包括:
(1)设定可以达到的目标并明确所有需求
(2)确定系统体系结构
从实施的角度来看,设计数据仓库系统体系结构有多种方式:
构造部门级的数据集市DataMart
直接构造企业级的数据仓库DataWarehouse系统
先建立部门级数据集市,然后发展成企业级数据仓库系统
(3)确定数据源
列出向数据仓库提供数据的数据源清单。源数据的复杂性、规模、完整性对建立数据仓库的影响比其它因素要大。要格外注意哪些数据源的数据类型、粒度和内容是兼容的。
(4)容量规划
除了体系结构之外,硬件和软件资源对数据仓库也至关重要。作为需求定义的一部分,估计数据仓库将要存储的数据量以及将对数据进行的处理很重要。
(5)技术评价
在选择软件和硬件平台时,最好听取专家的建议,尤其是对与您相似的环境有经验的专家。InformixDecisionFrontier数据仓库实现套件,为用户提供了快速、集成、完整的数据仓库实现工具。
2.逻辑模型设计
逻辑模型设计主要是指数据仓库数据的逻辑表现形式。从最终应用的功能和性能的角度来看,数据仓库的数据模型也许是整个项目最重要的方面。为数据仓库和数据集市定义数据模型是一项复杂的工作,需要领域专家的参与。
3.物理模型设计
在进行物理模型设计时,主要是将数据仓库的逻辑模型转换为在数据库中的物理表结构。在物理模型设计时,可以采用ERWin等辅助设计工具。
Informix采用ROLAP方式,数据仓库数据的存储主要采用InformixIDS(InformixDynamicServer)数据库。InformixIDS数据库是业界领先的数据库引擎,它具有并发性、可伸缩性、多进程/多线索等特性,是Informix数据仓库应用的核心。
4.数据抽取、清洗、集成、装载等
数据抽取是数据仓库建立中的一个非常重要的步骤。它负责将分布在用户业务系统中的数据进行抽取、清洗、集成。
(1)定义数据载入和维护策略
(2)数据抽取/清洗/转换/装载
Informix提供了一系列工具访问存储在异构数据库中的业务系统数据。Informix还提供了数据复制产品,这样,系统会通过同步或异步方式自动将符合规则的数据定时进行传递,保证数据的完整性、一致性。
用户利用Informix的InfoMover可以轻松定义数据抽取、清洗、集成、装载过程,并可以对该过程进行定期调度,减轻数据增量装载的复杂度。同时,Informix数据装载策略支持第三方厂家丰富的工具,如Prism、Carleton、ETI等。
5.数据仓库的管理
数据仓库元数据的管理也是极为重要的环节。Informix的MetacubeWarehouseManager提供GUI,用户只须使用鼠标托拽方式即可对元数据进行管理。
6.数据的分析、报表、查询等数据的表现
用户分析、报表、查询工具是用户进行分析决策使用的工具。因此,其所有操作要非常简单,但提供的功能却要十分强大。Informix相应地提供了一套完善的工具。
此外,数据挖掘技术也是数据仓库系统中一个重要部分。Informix提供RedBrickDataMine以及第三方厂商产品,支持数据挖掘应用。
7.数据仓库性能优化及发布
数据仓库性能的好坏直接影响系统查询、分析响应速度。Informix提供MetaCube等工具支持汇总查询、抽样查询和后台查询,以提高数据仓库查询效率。
总之,Informix为用户数据仓库应用提供了一个快速、完整的解决方案。采用Informix数据仓库解决方案可以使您的数据仓库系统具有高性能、高可扩展性,高开放性,可以自己进行定制等特性,同时,Informix还提供专业数据仓库咨询服务,这将充分保证您的数据仓库系统建设快速、及时,保证它能真正发挥作用。