商业智能通常被理解为将企业中现有的数据转化为知道,帮助企业作出明智的业务经营决策的工具。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。在三大技术支柱中,数据仓库是商务智能的基础。数据仓库是一个用以更好地支持企业或组织的决策分析处理的数据集合,它有面向主题、集成、相对稳定、随时间不断变化四个特性,将数据仓库与传统的面向事务处理的数据库
区分开来。数据仓库的关键技术包括数据的抽取、清洗、转换、加载和维护技术。联机分析处理(OLAP)是以海量数据为基础的复杂分析技术。它支持各级管理决策人员从不同的角度快速灵活地对数据仓库中的数据进行复杂查询和多维分析处理,并且能以直观易懂的形式将查询和分析结果展现给决策人员。可以说:联机分析处理是数据仓库之上的增值技术,值得深入探讨与研究。
一、OLAP概述
OLAP是关系型数据库之父E.F.Codd在1993年提出的多维数据库和多维分析的概念。OLAP是针对特定问题的联机数据访问和分析,通过对信息很多种可能的观察形式进行快速、稳定、一致和交互性的存取,允许管理决策人员对数据进行深入观察。
1. 数据仓库中用于OLAP的常用数据模式
数据仓库模式是数据仓库的核心和基础,是影响信息组织和查询的关键因素。因此一个有效的数据仓库模式就成为数据仓库设计的关键所在。在实际的应用当中是通过OLAP来进行分析,因此数据仓库中数据的模式结构应该便于分析。在传统的数据库中数据模式以ER图和二维表为主,而在数据仓库中则以多维模式为主。数据仓库的模式现在常用的有星形模式、雪花模式和星座模式。在数据仓库中,依据所选定的主题、所要存储的数据内容、支持数据仓库的系统环境、对象间的关系来决定使用哪种模式。
(1)星型模式
星型模式可能是最简单的数据仓库模式。因为它的实体关系图是从一个中心表向外辐射连接各维表,看起来像是一个星星。
星型模式主要有如下优点:在星型模式中进行的复杂查询,可以直接通过各维的层次比较、上卷、下钻等操作完成,大大减少用户的查询响应时间;大量的商业智能工具(BI)都支持星型模式;星型模式既可以被用在简单的数据集市上也可以被应用在巨型数据仓库上。
(2)雪花模式
雪花模式是一种比星型模式更繁杂的数据仓库模式,实际上它也是星型模式的一种。因为从它的实体关系图上看像雪花状,所以它就被称为雪花模式。
雪花模式通过对维表的规范化来消除冗余的数据。它的优点是通过最大限度地减少数据存储量以及把较小的规范化表(不是大的非规范化表)联合在一起来改善查询性能。由于采取了规范化和各维表较低的粒度,雪花模式增加了应用程序的灵活性。但雪花模式也增加了用户必须处理的表的数量,增加了某些查询的复杂性。
(3)星座模式
星座模式是星型模式的直接扩充,为了表示多个事实间的关系,可以共享多个维,这些共享维对每个拥有它的事实表来说都具有相同的意义。将多个星型模式连接在一起构成一种新的模式,称为星座模式。
2. OLAP的多维分析操作
在数据仓库的实现过程中,通过使用一定的数据模式建立多维数据结构——立方,通过在多维数据结构上的多种操作来完成分析人员与决策人员的分析需求。这些操作包括:钻取(roll up和drill down)、切片(alice)和切块(dice)、以及旋转(pivot)等。钻取是改变维的层次,变换分析的粒度。它包括向上钻取(roll up)和向下钻取(drill down)。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。
OLAP通过对数据库中的数据进行相应的操作从多个角度、多个侧面进行快速、一致和交互地存取,从而使分析人员能够对数据进行深入的分析观察。
3. OLAP的实现方法
OLAP有多种实现方法,根据存储数据的方式不同可分为MOLAP、ROLAP和HOLAP。MOLAP表示基于多维数据组织的OLAP实现(Multidemensional OLAP)。按照主题定义的OLAP分析所要的数据,生成并存储成多维数据库形成“超立方体”的结构。生成的多维立方体已经计算并生成了一些汇总值,当用户发出请求时,从多维立方体而不是数据仓库中取得数据,响应时间快。但由于多维立方体的生成造成了数据的存储空间增大,并且在多维立方体中不可能存储大量的细节数据,综合数据较多,所以分析的颗粒不会太细。
ROLAP表示基于关系数据库的OLAP实现(Relational OLAP)。ROLAP以关系型结构进行多维数据的表示和存储,只存储数据模型与数据仓库数据之间的映射关系,是真正的关系物理存储在数据仓库。进行多维分析时,OLAP服务器根据定义的模型和用户的分析需求从数据仓库中取得数据,进行实时分析。这样增加了响应时间,但相对MOLAP节省了空间,并且可以分析到具体细节数据,即考察数据的颗粒度较小。当分析应用的灵活性较大或进行多因素分析预侧时,应以ROLAP为主。
HOLAP表示基于混合数据组织的OLAP实现(Hybrid OLAP),如低层是关系型的、高层是多维矩阵型的。这种方式具有更好的灵活性。
二、OLAP技术在电力行业的应用前景
随着管理信息系统的发展,电力行业积累了大量基础数据,越来越多的电力企业认识到只有靠充分利用、发掘其现有数据,才能做出正确及时的决策,从而实现更大的经济效益,商业智能也随即被引入电力行业参与企业决策。商业智能的过程是从不同的数据源收集的数据中提取有用的数据、对数据进行清理、转换、重构后存入数据仓库或数据场中,然后用合适的查询、分析、数据挖掘、OLAP工具对信息进行处理,最后将有用信息呈现在用户面前,转变为决策。因此,电力企业需要在这些原始数据的基础上,构建企业的数据仓库和OLAP系统,对大量数据进行提取、分析,并将分析结果以多维视图的方式展示给决策者。
通过最大限度地利用电力企业资源中的数据,将数据整理为信息,再升华为知识,为电力行业管理层提供面向企业经营决策和面向生产统计、分析的功能,为决策者提供最为有效和准确的数据依据,提供高层决策参考,对制定行业的战略发展目标、市场策略,促进业务发展,完善服务质量,提高客户满意度等提供支持,从而提高风险控制能力和经营决策能力,提高企业的竞争力。
当前电力行业中,OLAP的研究现状可用下表1展示如下。
表1 OLAP的研究现状
通过OLAP技术进行分析,系统展现给决策者的不再是一张张二维表格,而是丰富多彩的各种图表。通过图表的直观展现,各种数据的比较一目了然,决策者还可以在图表中对数据进行相应的操作,找出决策者关心的数据。
三、结束语
多维数据分析(OLAP分析)作为决策支持系统提供的主要分析手段之一,通过对多维形式组织起来的数据采取钻取、切片、切块、旋转等操作来剖析数据,使决策者能从多个角度、多侧面地观察数据仓库的数据,从而深入地了解包含在数据中的信息内涵。OLAP技术在电力行业的应用,将更有利于电力企业决策者抬高决策水平,增强电力企业的竞争能力。
(编辑:黄蓉) |