天天看点

浅析:数据仓库主要技术和数据处理的主要步骤是怎么样的?

基于数据仓库的决策支持系统由三个部件组成:数据仓库技术,联机分析处理技术和数据挖掘技术,其中数据仓库技术是系统的核心,下面我们一起来了解一下数据仓库技术,现代数据仓库的主要技术和数据处理的主要步骤是怎么样的?在通信运营维护系统中如何使用这些技术为运营维护带来更好的帮助?

一、面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。主题是与传统数据库的面向应用相对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。每一个主题对应一个宏观的分析领域。数据仓库排除对于决策无用的数据,提供特定主题的简明视图。

浅析:数据仓库主要技术和数据处理的主要步骤是怎么样的?

二、数据仓库的用途:信息技术与数据智能大环境下,数据仓库在软硬件领域、Internet 和企业内部网解决方案以及数据库方面提供了许多经济高效的计算资源,可以保存极大量的数据供分析使用,且允许使用多种数据访问技术。

三、开放系统技术使得分析大量数据的成本趋于合理,且硬件解决方案也更为成熟。在数据仓库应用中主要使用的技术有:

1、并行:计算的硬件环境、操作系统环境、 数据库管理系统和所有相关的数据库操作、查询工具和技术、应用程序等各个领域都可以从并行的最新成就中获限收益。

2、分区:分区功能使得支持大型表格和索引更容易,同时也提高了数据管理和查询性能。

浅析:数据仓库主要技术和数据处理的主要步骤是怎么样的?

3、数据压缩:数据压缩功能大大降低了数据仓库环境中通常需要的用于存储大量数据的磁盘系统的成本,新的数据压缩技术也已经消除了压缩数据对查询性能造成的负面影响。

三、技术的发展:从数据库到数据仓库,企业的数据处理一般可分为两类:

1、操作型处理,也称为联机事务处理,它是针对具体业务在数据库联机的日常操作,一般是对少数记录进行查询、修改。

2、分析型处理,一般针对某些主题的历史数据进行分析,支持管理决策。

3、两者具有不同的特征,主要体现在以下几个方面:

1)、处理性能:日常业务涉及频繁、简单的数据存取,因此对操作型处理的性能要求是比较高的,需要数据库能够在很短时间内做出反应。

2)、数据集成:企业的操作型处理一般较为分散,传统数据库面向应用的特性使数据集成困难。

浅析:数据仓库主要技术和数据处理的主要步骤是怎么样的?

3)、数据更新:操作型处理主要由原子事务组成,数据更新频繁,需要并行控制和恢复机制。

4)、数据时限:操作型处理主要服务于日常的业务操作。

5)、数据综合:操作型处理系统通常只具有简单的统计功能。

继续阅读