数据仓库之数据冗余规范

2022-11-13 13:17:40 浏览数 (1)

在数据详细设计阶段设计宽表冗余维度属性时,应该遵循以下几个建议准则:

1.冗余字段与表中其它字段高频率(大于3个下游应用SQL)同时访问。

2.冗余字段的引入不应造成其本身的更新完成时间过多延迟。

3.公共层数据不允许字段重复率大于60%的相同粒度数据表冗余,可以选择原表基础上拓宽或者下游应用通过JOIN方式实现。

4.从一个集合中冗余一部分记录作为另外一张表存在时,可以优先考虑子分区方式,但是多级子分区不超过(5级),只有以下情况才考虑冗余:

       子类型表有较多(大于10)个字段父类型表并不存在。

       子集合的过滤条件被多次(大于5次)应用。

0 人点赞