理解维度建模
维度模型是由数据仓库领域的大师拉尔夫·金博尔倡导的。模型是基于分析和决策的需要而建立的,建立的数据模型服务于分析需要。因此,它侧重于用户如何更快地完成分析需求,同时对大规模复杂查询有更好的响应性能。
维度建模是数据仓库/商业智能项目成功的关键。为什么这么说?因为不管我们的数据量是从GB到TG还是PB,虽然数据量越来越大,但是数据呈现的成功一定是建立在简单性的基础上,而维度建模就是要时刻考虑如何提供简单性,以业务为驱动,以用户理解和查询性能为目标。
维度建模:维度建模是一种专门用于建模分析数据库、数据仓库和数据市场的方法。数据集市可以理解为一种“小型数据仓库”,它指导我们如何在数据仓库中构建表。
维度建模分为两个表:事实表和维度表。
事实表:一些必须存在的数据,比如收集的日志文件和订单表,可以用作事实表。
特性:它是主键的集合,每个主键对应维度表中的一条记录。它是客观存在的,根据主题确定要用的数据。
维度表:维度是被分析数据的数量,维度表是从一个合适的角度创建的表。分析问题的一个角度:时间、地域、终端、用户等。
维度建模的三种模式
星型模式:最简单最常用的一种,以事实表为中心,所有维度表都直接连接到事实表。
请点击输入图片说明。
雪花模式:雪花模式下的维度表可以有其他维度表,不容易维护,一般不推荐。
请点击输入图片说明。
星座模型:基于多个事实表,并且* * *享有维度信息,即一些维度表可以在事实表之间* * *共享。
请点击输入图片说明。