【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

2023-03-28 16:33:53 浏览数 (2)

文章目录

  • 一、特征一 : 面向主题 数据组织方式
  • 二、特征二 : 数据集成
  • 三、特征三 : 数据不可更新
  • 四、特征四 : 数据仓库中的数据 随时间不断变化

一、特征一 : 面向主题 数据组织方式


主题 :

  • 主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;
  • 逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;

较高层次 :

  • 层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高
  • 抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高

面向主题 数据组织方式 特点 :

  • 描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;
  • 内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;

详情参考 : 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | ) 四、特征一 : 面向主题 数据组织方式

二、特征二 : 数据集成


数据集成含义 :

  • 数据来源 : 从各个 子系统中的 分散的 OLTP 数据库 中 抽取 , 清洗 , 综合 , 得到 ;
  • 重要性 : 数据集成 是 数据仓库 创建 中 , 最关键 , 最复杂 的步骤 ;

数据集成 :

  • 数据统一 : 不同的数据来源 , 统一数据格式 , 包括 : 字段名称 , 字段含义 , 数据单位 , 数据长度 等 ;
  • 综合计算 : 对数据进行 综合 , 计算 ; 其中包含下面的 综合时间生成 ;
  • 综合时间 : 抽取数据时 生成综合时间 , 数据抽取完毕后 在 数据仓库 内部 生成综合时间 ;

三、特征三 : 数据不可更新


特征三 : 数据不可更新 :

  • 历史数据 : 数据仓库中的数据都是历史数据 ;
  • 查询操作 : 一般情况下 , 只能查询数据 , 不能对数据仓库中的数据进行 增删改 操作 ;
  • 删除操作 : 数据仓库中的数据超过期限后 , 可以删除 , 但是这是 数据仓库维护范畴的概念 , 不是用户操作的 ;

数据仓库管理系统 :

  • 简化数据管理 : 由于不能进行 增删改 操作 , 只能进行查询操作 , 一些数据管理功能可以简化 , 如 事务处理 , 脏数据 , 版本不一致 等功能可以简化 ;
  • 数据查询要求 : 需要支持大数据查询 , 有友好的查询界面 , 分析结果直观 ;

四、特征四 : 数据仓库中的数据 随时间不断变化


特征四 : 数据仓库中的数据 随时间不断变化 :

  • 数据仓库数据不可更新 : 针对用户而言 , 数据仓库中的数据 , 只能查询 , 不能 增删改 ;
  • 定期更新数据仓库数据 : 数据仓库中的数据是需要定期更新的 , 这属于数据仓库管理员的工作 , 属于数据仓库维护范畴的工作 ;

数据保存时间 :

  • OLTP 数据库 : 操作型数据库 一般保存 2 ~ 3 个月的历史数据 ;
  • OLAP 数据仓库 : 分析型数据仓库 一般保存 5 ~ 10 年历史数据 ;

数据仓库数据 随时间变化 :

  • 增加新数据 : 随着时间变化 , 数据仓库中需要添加最细的数据 , 定期更新数据 ;
  • 删除旧数据 : 随着时间变化 , 数据仓库中旧的历史数据需要删除 ;
  • 时间相关综合数据 : 数据仓库中需要维护大量与时间相关的综合数据 ;

时间相关的综合数据 :

  • 时间段 : 按时间段 进行数据综合 ;
  • 抽样 : 每隔一定时间片 , 进行数据抽样 ;
  • 重新综合 : 随时间变化 , 不断重新综合数据 ;

数据仓库码键 : 时间项包含在数据仓库的码键中 , 可以从码键中看出数据的历史时期 ;

0 人点赞