数据仓库一般分为三层,包括:
操作型数据层(Operational Data Layer):也称为源数据层,存储从业务系统中抽取的原始数据,这些数据一般具有高度的异构性和复杂度。这层数据主要是面向操作系统的,通常采用关系型数据库或NoSQL数据库实现。
数据集成层(Integration Layer):也称为中间层或数据加工层,负责将操作型数据层中的数据进行清洗、转换、整合和汇总,以产生可供决策支持和分析的数据。这层数据主要是面向数据仓库的,通常采用ETL工具或数据集成平台实现。
决策支持层(Decision Support Layer):也称为前端层或查询层,主要是面向数据分析师和决策者的,为他们提供直观、易用、高效的查询、分析和报表功能。这层数据通常采用数据挖掘、OLAP、数据可视化等技术实现。