Kimball推崇数据集市的集合为数据仓库,同时也提出了对数据集市的维度建模,将数据仓库中的表划分为事实表、维度表两种类型。
- 事实表 在ER模型中抽象出了实体、关系、属性三种类别。
在现实世界中,每一个操作型事件,基本都是发生在实体之间的,伴随着这种操作事件的发生,会产生可度量的值,而这个过程就产生了一个事实表,存储了每一个可度量的事件。
比如电商场景:一次购买事件,涉及主体包括客户、商品、商家,产生的可度量值包括商品数量、金额、件数等。
- 维度:维度,很显然就是看待事物的角度。比如从颜色、尺寸的角度来比较手机的外观,从CPU、内存等比较手机性能。
维度表一般为单一主键,在ER模型中,实体为客观存在的事务,会带有自己的描述性属性,属性一般为文本性、描述性的,这些描述被称为维度。
比如商品,商品ID是单一主键,属性包括产地、颜色、材质、尺寸、单价等,但并非属性一定是文本,比如单价、尺寸均为数值型描述性的。
日常主要的维度抽象包括:时间维度表、地理区域维度表等。