一、数仓的意义
二、数据体系
- 数据体系构成
在这里插入图片描述
- 常见技术架构 偏离线:适用于业务初期,迅速形成数仓雏形,快速交付满足业务
在这里插入图片描述 离线 实时:适合业务中后期,形成扩展性极强的技术架构
在这里插入图片描述 偏实时:适合特殊业务,例如:广告、风控
三、数仓分层
数仓分层&主题 数据缓冲层:数据暂存区,只保留每天的增量数据 数据明细层:全量数据区,采用全量表、快照表、拉链表等保存全量数据,并做基础数据的归一化处理和模型的拆解、合并,多采用ER建模 数据衍生层:数据聚合区,多用于轻度汇总以及衍生计算,产出标准化数据,屏蔽上游业务变更对下游的影响。 数据集市层:数据集成区,基于角色 场景构建场景化数据模型。 数据应用层:数据交付区,提供数据服务以及数据产品的数据。