在数据详细设计阶段设计宽表冗余维度属性时,应该遵循以下几个建议准则:
1.冗余字段与表中其它字段高频率(大于3个下游应用SQL)同时访问。
2.冗余字段的引入不应造成其本身的更新完成时间过多延迟。
3.公共层数据不允许字段重复率大于60%的相同粒度数据表冗余,可以选择原表基础上拓宽或者下游应用通过JOIN方式实现。
4.从一个集合中冗余一部分记录作为另外一张表存在时,可以优先考虑子分区方式,但是多级子分区不超过(5级),只有以下情况才考虑冗余:
子类型表有较多(大于10)个字段父类型表并不存在。
子集合的过滤条件被多次(大于5次)应用。