目录
数据仓库为什么要分层 ?
1.把复杂的问题简单化
2. 结构更清晰
3.数据血缘追踪
4.用空间换时间
5.数据重复使用,减少重复开发
6.数据隔离,屏蔽原始数据的异常
7.数据安全
8.增强扩展性,利于后期维护
数据仓库为什么要分层 ?
1.把复杂的问题简单化
2. 结构更清晰
每一个数据分展都有它的作用域,这样我们在使用表的时候能更方便地定位和理解。方便数据血缘追踪。简单来说,我们最终给业务呈现的是一个能直接使用业务表,但是它的来源有很多,如果有一张来源表出问题,我们希望能够快速准确地定位到问题,并清楚它的危害范围
3.数据血缘追踪
4.用空间换时间
通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量的冗余数据
5.数据重复使用,减少重复开发
规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算
6.数据隔离,屏蔽原始数据的异常
不论是数据的异常还是数据的敏感性,使真实数据与统计数据解耦开.
不必改一次业务就需要重新接入数据。另外,随着业务的变化,只需要调整底层的数据,对应用层对业务的调整零感知。
7.数据安全
通过分层,可以更方便地对不同层,不同的数据模型进行权限管理,特定业务场景下,对不同的开发人员和业务人员屏蔽一些敏感的数据。