大家都知道,企业要做数据分析,商业智能BI和数据仓库二者缺一不可。许多人在疑惑,我的数据仓库还没有建立起来,怎么做商业智能BI呢?真得在做商业智能BI之前先建数据仓库吗?
无论哪一种BI项目,都需要从各级管理者的决策性思维出发,建立分主题的数据模型,从而形成数据仓库,无论其存在形式如何,数据仓库的分析思路必然贯穿于整个项目,并涵盖各个层级的发展战略和业务表单。
数据仓库的逻辑
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。
数据仓库系统区别于数据库
一般意义上的数据库,指由单个业务系统存储的数据集,其作用是对业务系统流程生成的数据进行处理,以便于对各个流程生成的数据进行存储。
为了满足决策分析的需要,数据仓库被建立起来,其面向主题的设计,会随着数据特性的变化而增加或减少,例如数据之间的兼容性和互斥性,它的数据容量将比业务数据库大五倍以上。
一般来说,数据仓库应该单独建立,以减少对业务数据库的干扰。他利用数据库的实现。他借助于数据库实现。如关系型数据库,多维数据库、内存数据库等,这些都可以作为数据仓库来使用。数据仓库的建立,有以下几个主要方面工作:
①整合业务数据;②主数据管理;③元数据管理;④数据质量管理;⑤数据清洗和转换;⑥数据装载,⑦主题建模等,最终支持各级管理者的数据分析、业务预测、决策。
商业智能BI的逻辑
商业智能(Business Intelligence)是一种对商业信息进行收集、管理和分析的过程,它通常包括数据库技术、数据仓库(或数据场)、联机分析处理(OLAP)等几个方面,其实现涉及可视化、交互等动态分析型软件。
各级别的管理人员都以数据仓库为本,利用各种查询分析工具(Query/ReportTools)、联机分析处理(OLAP)或数据挖掘(Data Mining)工具以及决策者的行业知识,从数据仓库中获取有用的信息,从而帮助企业获利,并提高生产力和竞争力。
商业智能BI不是简单的报表和漂亮的图形,它主要考虑的是模型交付能力和工具软件的开放性。面对海量数据,提高信息的利用率,快速、准确地找到所需信息,做出正确的决策,是商业智能BI发展的驱动力。
由此不难看出,任何BI项目,都需要从各级管理者的决策性思维出发,建立分主题的数据模型,从而形成数据仓库,无论其存在形式如何,分析思想都必须贯穿于整个项目,并涵盖各个层次的发展战略和业务表单,随时纳入外部数据,以保证决策的科学性和前瞻性,满足整个决策过程。
不推荐将数据仓库单独作为一个项目,因为在业务分析需求不确定的情况下建立数据仓库,将会带来巨大的风险。而且企业总有数据无法及时入数据仓库,有很多暂时需要分析但又没有放入数据仓库的外部数据,同样对分析决策起着重要作用。