● 数据仓库是一个面向主题的、集成的、随时间变化的、包含汇总和明细的、稳定的历史数据集合。
● 数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用于支持管理决策。
● 与传统关系数据库不同,数据仓库系统的主要应用是OLAP,支持复杂的分析操作,侧重决策支持,
并且提供直观易懂的查询结果。这个阶段,数据架构不仅关注数据模型,还关注数据的分布和流向。
组成:
● 数据仓库通常由数据源、数据的存储与管理、OLAP服务器、前端工具等组件构成。
1、数据源
数据源是数据仓库系统的基础,是整个系统的数据源泉
数据源包括企业的内部信息和外部信息
内部信息包括:存放于关系型数据库管理系统中的各种业务处理数据和各类文档数据
外部信息包括:各类法律法规、市场信息和竞争对手的信息等
2、数据的存储与管理
数据的存储与管理是整个数据仓库系统的核心
数据仓库按照数据的覆盖范围可以分为:企业级数据仓库和部门级数据仓库(通常称为数据集市)。
3、OLAP(On-Line Analysis Processing,联机分析处理)服务器
对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。
其具体实现可以分为:ROLAP(关系数据的关系在线分析处理)、MOLAP(多维在线分析处理)和HOLAP(混合在线分析处理)。
ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;
HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。
4、前端工具
前端工具主要包括:各种查询工具、报表工具、分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。
其中,数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。
非特殊说明,本文版权归 看美景 所有,转载请注明出处.
本文标题: 第二章 信息技术发展 一一 数据仓库