【DBMS 数据库管理系统】OLAP 核心技术 : 多维数据模型 ( 多维数据模型 | 维 | 维成员 | 维层 | 维层次 | 维属性 | 度量 )

2023-03-28 16:35:28 浏览数 (1)

文章目录

  • 一、OLAP 核心技术
  • 二、OLAP 多维数据模型
  • 三、OLAP 多维数据模型 核心概念
  • 四、维
  • 五、维成员
  • 六、维层
  • 七、维层次
  • 八、维属性
  • 九、度量

一、OLAP 核心技术


OLAP 核心技术 :

  • 多维数据模型
  • 多维分析操作
  • 多维查询及展示
  • 数据方体技术

二、OLAP 多维数据模型


"用户数据视图" 概念 : 在数据分析时 , 用于面向分析的数据模型 , 用于为分析人员提供 多种观察数据的视角 , 和 面向分析的操作 ;

"多维数据模型" 作用 : 多维数据模型 是 数据仓库 和 OLAP 联机分析处理 的 基础 ;

"多维数据模型" 表示 :

  • 多维数组 : 多维数据模型 的 数据结构 , 可以使用 多维数组 表示 ;
  • 实例 : 维度
1

, 维度

2

,

cdots

, 维度

n

, 维度之间的交叉点 , 存放度量值 , 每个度量值由若干数据组成 ; 如 二维数据 , 维度

1

x

轴 , 维度

2

数据是

y

轴 , 每个

x,y

都可以定位一个度量值 ;

"多维数据模型" 本质 : 多维数据模型 本质是 多维空间 , “维” 表示用户观察的对象 , 观察角度 , 多维空间中的 “点” 表示 度量 的值 ; OLAP 采用 “多维数据模型” ;

"多维数据模型" 与 传统的关系数据模型不同 :

  • OLTP 关系数据模型 : 传统关系数据模型是二维的 , 关系数据库有一套 “关系-代数理论” , 有非常深厚的数学基础 ;
  • OLAP 多维数据模型 : 多维数据模型是 随着 OLAP 产品的流行出现 , 缺乏理论基础 , 目前没有统一的多维数据模型 ;

"多维数据模型" 不同表示方式 :

  • 使用 “关系模型” 表示 多维数据模型 ;
  • 将 多维数据模型 形式化为 “多维空间” ;

三、OLAP 多维数据模型 核心概念


OLAP 多维数据模型 核心概念 :

  • 维成员
  • 维层
  • 维层次
  • 度量

四、维


"维" 简介 :

  • "维" 概念 : 人们 观察数据的 特定角度 , 事物的属性 ;
  • "维" 作用 : “维” 是商业活动的 基本要素 , 每个 “维” 有唯一的名称 , 如 时间维 , 地区维 等 ;

"维" 示例 : 分析 商品销售 数据 , 涉及 商品的 时间 , 地区 , 就是维 ;

  • 时间维 : 商品在不同的时间的销售情况 ;
  • 地区维 : 商品在不同的地区的销售情况 ;

五、维成员


"维成员" 简介 :

  • 维 与 “维成员” : 维 是由若干 “维成员” 组成 ; 维的 一个取值 称为 “维成员” , 每个 “维成员” 都有一个名字 , 可以有 若干属性 描述 “维成员” 特征 ;
  • 多维层 “维成员” : 维 可能是 多层的 , 该 维 的 “维成员” 可以是 在不同 维层 上的取值组合 ;

"维成员" 示例 :

  • "时间维" 示例 : 以 “时间维” 为例 , 时间维上有
100

个时间数据 , 每个时间数据都是一个 “维成员” ;

3

个维层次 : “时间维” 有 : 年 , 月 , 日 , 三个层次 ;

  • 多维层 “维成员” : 每个时间数据 ( “维成员” ) 可以由
3

个维层的数据组成 , 如

2020

02

02

日 , 分别是 年 , 月 , 日 , 三个维层 的数据 ;

  • 单维层 “维成员” : 也可以只使用一个 维层 的数据 , 如
2020

年 , 只有一个维层的数据 ;

  • "维成员" 取值灵活 : “维成员” 取值 既可以使用 维 的全部维层数据 , 也可以只取一个维层的数据 , 也可以选择若干 维层 数据组合 ;

六、维层


"维层" 简介 :

  • "维层" 概念 : 观察数据时 , 除了从 某一角度 观察外 , 还需要 从 “不同细节程度” 去观察 , 这些 不同的细节程度 , 称为 “维层” ;
  • "维层" 示例 : 时间维 : 日 , 月 , 年 , 是时间维 的 维层 ; 地区维 : 街道 , 城市 , 省份 , 国家 , 是地区维的 维层 ;
  • "维层" 描述 : 维层 描述了 数据的 细节程度 , 抽象级别 , 每个维层都有一个名称 , 维层之间存在抽象级别决定关系 , 如上述地区维 , 国家下有很多省份 , 省份下有很多城市 , 城市下有很多街道 ;
  • "维层" 成员 : 每一个维层的具体取值 , 称为 维层成员 , 如 地区维 , 国家维层 , 有中国 , 美国 , 省份维层有 广东 , 浙江 ;
  • "维层" 本质 : 维层 本质上 是 对 维成员 的 组织分类方法 ;

七、维层次


"维层次" 简介 :

  • "维层次" 概念 : 若干 维层 可以构成 分类方法 , 在 维 中 , 可以有多个分类方法 , 每种分类方法叫做 “维层次” ;
  • "维层次" 示例 : 以 时间维 为例 , 按照 年 -> 季度 -> 月 -> 日 进行分类 , 这是一个维层次 , 也可以 按照 年 -> 月 -> 周 进行分类 , 这也是一个维层次 ; 上述是 时间维 的 两个维层次 ; 不同维层的组织方法 , 称为维层次 ;

八、维属性


"维属性" 简介 :

  • "维属性" 概念 : 维属性 用于 说明 维成员 具有的特征 ;
  • "维属性" 定义位置 : 维属性可以 定义在维成员上 , 也可以 定义在维层上 ; 如果将维属性 定义为维层上 , 那么该层次上的每个维成员都具有该属性 ;
  • "维属性" 定义示例 : 维成员 是 商店 , 为商店 定义 负责人 属性 , 可以直接在该 商店 维成员上定义 , 可以在 地区维 下定义该属性 , 如果在地区维 定义维属性 , 那么该地区所有的商店的负责人都是同一个人 ;

九、度量


"度量 " 简介 :

  • "度量" 概念 : 分析的 目标 或 对象 , 称为 度量 ;
  • "度量" 表示 : 度量一般有 名字 , 数据类型 , 单位 , 公式 等属性 ;
  • 输入 “度量” : 从业务活动中获取的值 ; 如 销售额 ;
  • 导出 “度量” : 经过计算得到的值 ; 如 利润 ;
  • 聚集计算 : 求和 , 求平均值 等操作 ;
  • 可累计型 “度量” : 可以沿 时间维 做聚集计算 , 称为 可累计型 的度量 , 如营业额 ;
  • 不可累计型 “度量” : 不能沿 时间维 做聚集计算 , 称为 不可累计型 的度量 , 如库存 , 不能将不同时间的库存累加起来 ;

“度量” 是 多个 “维” 的 交叉点 ;

0 人点赞