(本科)chap04-OLAP概述及模型.ppt

上传人:春哥&#****71; 文档编号:15364166 上传时间:2022-05-12 格式:PPT 页数:70 大小:710.50KB
返回 下载 相关 举报
(本科)chap04-OLAP概述及模型.ppt_第1页
第1页 / 共70页
(本科)chap04-OLAP概述及模型.ppt_第2页
第2页 / 共70页
点击查看更多>>
资源描述

《(本科)chap04-OLAP概述及模型.ppt》由会员分享,可在线阅读,更多相关《(本科)chap04-OLAP概述及模型.ppt(70页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、课程主讲人:chap04-OLAP概述及模型概述及模型第四章第四章 联机分析处理(联机分析处理(OLAP)-概述及模型概述及模型 OLAP(On_Line Analytical Processing):):用于支持复杂的分析操作,侧重对决策人用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持员和高层管理人员的决策支持 联机分析处理(联机分析处理(OLAP) 4.1 OLAP技术概述技术概述 4.1.1 OLAP的起源的起源1993年,年,E.F.Codd 提出提出“OLAP”概念引起了概念引起了很大反响很大反响OLAP作为一类产品同作为一类产品同OLTP明显区分开来明显区分开来4.

2、1.2 OLAP的定义的定义 OLAP委员会给出的一个定义是这样的:委员会给出的一个定义是这样的:OLAP是使分析人员、管理人员或执行人员能够从多种是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业多维特性的信息进户所理解的、并真实反映企业多维特性的信息进行快速、一致、交互地存取,从而获得对数据的行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。更深入了解的一类软件技术。 4.1 OLAP技术概述技术概述 OLAP是供管理人员使用的一种软件,物理上要是供管理人员使用的一种软件

3、,物理上要能对用户提出的各类复杂查询快速响应,逻辑上能对用户提出的各类复杂查询快速响应,逻辑上要具备多维建模的能力,主要特点有要具备多维建模的能力,主要特点有:快速性快速性可分析性可分析性多维性多维性及时性及时性 4.1.2 OLAP的定义的定义 OLTP 数据数据 OLAP 数据数据 原始数据原始数据 导出数据导出数据 细节性数据细节性数据 综合性或提炼性数据综合性或提炼性数据 当前值数据当前值数据 历史数据历史数据 可更新可更新 不可更新但周期性刷新不可更新但周期性刷新 一次处理的数据量小一次处理的数据量小 一次处理的数据量大一次处理的数据量大面向应用,事务驱动面向应用,事务驱动 面向分析

4、,分析驱动面向分析,分析驱动 面向操作人员,支持日常操作面向操作人员,支持日常操作 面向决策人员,支持管理需要面向决策人员,支持管理需要表表4-1、 OLTP与与OLAP比较表比较表4.1.3 OLTP与与OLAP的关系及比较的关系及比较 4.1.4 OLAP核心技术核心技术OLAP的核心技术包括的核心技术包括:多维数据模型、多维分析多维数据模型、多维分析操作、多维查询及展示、数据方体技术等。操作、多维查询及展示、数据方体技术等。多维数据模型是数据仓库和联机分析处理技术的多维数据模型是数据仓库和联机分析处理技术的基础。多维数据模型的数据结构可以用一个多维基础。多维数据模型的数据结构可以用一个多

5、维数组来表示数组来表示。 销售额(万元)销售渠道销售渠道 北京北京 地区地区 1 2 3 4 时间(月)时间(月)图图4-1 按数据方体表示的商品销售数据示例按数据方体表示的商品销售数据示例 4.1.4 OLAP核心技术核心技术 4.2 多维数据模型多维数据模型多维数据模型主要研究多维数据的抽象表示问题。多维数据模型主要研究多维数据的抽象表示问题。通常用一个数据方体来表示一个多维空间,允许通常用一个数据方体来表示一个多维空间,允许管理决策人员对多维数据从不同的角度进行快速、管理决策人员对多维数据从不同的角度进行快速、稳定和交互式的观察和存取。稳定和交互式的观察和存取。 4.2.1 基本概念基本

6、概念一、维一、维:维是人们观察数据的特定角度,是某个事物的属维是人们观察数据的特定角度,是某个事物的属性性。维是商业活动中的一个基本要素维是商业活动中的一个基本要素,每个维都每个维都有一个唯一的名字有一个唯一的名字。(1)维成员)维成员:维由一些维成员构成。维的一个维由一些维成员构成。维的一个取值称为维的一个成员,每个成员有一个名字,取值称为维的一个成员,每个成员有一个名字,还可以有若干的属性来描述成员的特征。如果一还可以有若干的属性来描述成员的特征。如果一个维是多层的,那么该维的维成员是在不同维层个维是多层的,那么该维的维成员是在不同维层上的取值的组合。上的取值的组合。 4.2.1 基本概念

7、基本概念(2)维层)维层:观察数据时,除了要从某一个角度观察数据时,除了要从某一个角度去观察外,还需要从不同的细节程度去观察去观察外,还需要从不同的细节程度去观察,称称这些不同的细节程度为不同的维层。维层描述现这些不同的细节程度为不同的维层。维层描述现实中的细节程度、抽象级别,每个层都有一个名实中的细节程度、抽象级别,每个层都有一个名字,层之间一般存在由抽象级别决定的关系。字,层之间一般存在由抽象级别决定的关系。 4.2.1 基本概念基本概念 4.2.1 基本概念基本概念(3)维层次)维层次:层实际上是一种分类方法层实际上是一种分类方法,把每种分把每种分类方法叫做一个层次类方法叫做一个层次。

8、4.2.1 基本概念基本概念(4)维属性)维属性:维属性说明维成员所具有的特征。维属性说明维成员所具有的特征。可以在每个维成员上定义,也可以在维层上定义。可以在每个维成员上定义,也可以在维层上定义。在维层上定义属性意味着维层中的每个维成员都具有在维层上定义属性意味着维层中的每个维成员都具有该属性。该属性。 4.2.1 基本概念基本概念二二、度量、度量 :度量是要分析的目标或对象。度量是要分析的目标或对象。度量有输入度量和导出度量之分度量有输入度量和导出度量之分。度量还可以分为可累计型和不可累计型。度量还可以分为可累计型和不可累计型。 4.2.1 基本概念基本概念三、数据方体三、数据方体 :多维

9、数据模型构成的多维数据空间称作数据方体多维数据模型构成的多维数据空间称作数据方体(Data Cube,简记为,简记为Cube),也称为数据立),也称为数据立方体,超级立方体,多维超方体等。一个数据方方体,超级立方体,多维超方体等。一个数据方体由多个维和度量组成。体由多个维和度量组成。 4.2.1 基本概念基本概念四、数据单元四、数据单元 :数据方体以维为数轴。在一个数据方体中,当每数据方体以维为数轴。在一个数据方体中,当每个维上都确定了一个维成员时,就会唯一地确定个维上都确定了一个维成员时,就会唯一地确定多维空间中的一个点。我们把这个点称作一个数多维空间中的一个点。我们把这个点称作一个数据单元

10、(据单元(Cell)。)。 4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型一一、星形模型:星形模型:星型模型是多维数据模型的基本结构,通常由一个星型模型是多维数据模型的基本结构,通常由一个很大的中心表和一组较小的表组成很大的中心表和一组较小的表组成。1. 大的中心表通常被称为事实(大的中心表通常被称为事实(fact)表)表,用来存用来存储事实的度量值及各个维的码值储事实的度量值及各个维的码值。2. 与事实表相连接的周围的那组小的表通常被称为与事实表相连接的周围的那组小的表通常被称为维表维表,用来保存该维的信息,即每个维成员的信息,用来保存该维的信息,即每个维成员的信息,包括维的属性信

11、息和维的层次信息等。包括维的属性信息和维的层次信息等。 “星型模式星型模式”(Star Schema) 产品代码产品代码 产品维表产品维表地理维表地理维表销售事务表销售事务表销售渠道维表销售渠道维表 邮邮 政政 编编 码码 产品代码产品代码 销售商代码销售商代码 邮政编码邮政编码 总收益总收益 销售数量销售数量 财政星期序号财政星期序号 销销 售售 商商 代代 码码 时间维表时间维表 财政星期序号财政星期序号图4-5 : 用关系表达多维概念的示例图星型模式4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型 4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型二二、雪片模型:雪片模型:

12、也称雪花模型,是对维表进行规范化后形成的。也称雪花模型,是对维表进行规范化后形成的。星型模型和雪片模型的主要区别在于雪片模型中的星型模型和雪片模型的主要区别在于雪片模型中的维表是规范化的,这样的维表不但易于维护而且节维表是规范化的,这样的维表不但易于维护而且节省存储空间。但是,雪片模型的这种结构在执行查省存储空间。但是,雪片模型的这种结构在执行查询时需要进行较多的连接操作,可能影响系统的性询时需要进行较多的连接操作,可能影响系统的性能。能。 雪片模式雪片模式(Snow Flake Schema): 星型模式的变种星型模式的变种商标表商标表公司表公司表产品表产品表产品小类表产品小类表产品类表产品

13、类表 产品代码产品代码 产品名称产品名称 产品小类代码产品小类代码 产品小类名称产品小类名称 产品类代码产品类代码 产品类名称产品类名称 公司代码公司代码 公司名称公司名称 商标代码商标代码 商标名称商标名称 商标代码商标代码 公司代码公司代码 产品类代码产品类代码 产品小类代码产品小类代码 产品代码产品代码 产品维表产品维表 产品代码产品代码(后续)(后续)4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型 图图4-6: 用关系表达多维概念的示例图雪片模式用关系表达多维概念的示例图雪片模式地理维表地理维表 销售渠道维表销售渠道维表零售商表零售商表 城市名称城市名称 国家国家 地区地区

14、邮政编码邮政编码 产品代码产品代码 销售商代码销售商代码 邮政编码邮政编码 成本成本 总收益总收益 销售数量销售数量 财政星期序号财政星期序号 销销 售售 商商 代代 码码 零售商代码零售商代码 零售商名称零售商名称 销售商店表销售商店表 零售商代码零售商代码 销售店代码销售店代码 销售店名称销售店名称 当前时间当前时间 财政星期序号财政星期序号 财政年度序号财政年度序号时间维表时间维表财政年度表财政年度表财政星期表财政星期表 财政星期序号财政星期序号 财政星期名称财政星期名称 财政年度序号财政年度序号 财政年度名称财政年度名称 财政星期序号财政星期序号 邮邮 政政 编编 码码销售事务表销售事

15、务表4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型 4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型三三、事实群模型、事实群模型:在某些复杂的应用中,可能需要多个事实表来共享维表,在某些复杂的应用中,可能需要多个事实表来共享维表,这种模型类似于星型模型的集合,被称为星系模型或事实这种模型类似于星型模型的集合,被称为星系模型或事实群模型。群模型。 4.2.2 星形、雪片和事实群模型星形、雪片和事实群模型三三、事实群模型、事实群模型: 4.3 多维分析操作多维分析操作多维数据模型主要研究多维数据的抽象表示问题。多维数据模型主要研究多维数据的抽象表示问题。通常用一个数据方体来表示一

16、个多维空间,允许通常用一个数据方体来表示一个多维空间,允许管理决策人员对多维数据从不同的角度进行快速、管理决策人员对多维数据从不同的角度进行快速、稳定和交互式的观察和存取。稳定和交互式的观察和存取。 4.3.1 多维分析的基础:聚集多维分析的基础:聚集最常用的最常用的5种聚集函数是:求和(种聚集函数是:求和(sum),计数),计数(count),求最大值(),求最大值(max),求最小值),求最小值(min),求平均(),求平均(average)。)。数据单元(数据单元(T1,济南,济南,P1;X)中中X=?,?,显然,显然,X=Sum(100,78,97)。)。 4.3.1 多维分析的基础:

17、聚集多维分析的基础:聚集聚集函数可以分为三类:聚集函数可以分为三类:(1)分布型聚集函数)分布型聚集函数:将数据分成将数据分成n份,对其中的每一份份,对其中的每一份应用该函数,可以得到应用该函数,可以得到n个聚集值,对这个聚集值,对这n个聚集值进行计个聚集值进行计算得到的结果如果和整个数据(不划分)应用该函数得出算得到的结果如果和整个数据(不划分)应用该函数得出的结果一致的话,则说该函数是分布型的。的结果一致的话,则说该函数是分布型的。(2)代数型聚集函数)代数型聚集函数:如果一个函数可以由若干个分布型如果一个函数可以由若干个分布型函数进行代数运算得出,则说该函数是代数型的。函数进行代数运算得

18、出,则说该函数是代数型的。(3)整体型聚集函数)整体型聚集函数:如果一个函数不能由其他的函数进如果一个函数不能由其他的函数进行代数运算得出,则说该函数是整体型的。行代数运算得出,则说该函数是整体型的。 4.3.2 常用的常用的多维分析多维分析操作操作常用的多维分析操作有:常用的多维分析操作有:一、切片(一、切片(Slice)二、切块(二、切块(Dice)三、旋转(三、旋转(Rotate)四、四、下钻(下钻(drill down)五、五、上卷(上卷(roll up) 一、切片(一、切片(Slice) 定义定义1:在多维数组的某一维上选定一维成员:在多维数组的某一维上选定一维成员的动作称为切片,即

19、在多维数组(维的动作称为切片,即在多维数组(维1,维,维2,,维维n,变量)中选一维:维变量)中选一维:维i , 并取其一维成员并取其一维成员(设为维成员(设为维成员vi),所得的多维数组的子集(所得的多维数组的子集(维维1,,维成员维成员vi,维维n,变量)称为在维变量)称为在维i上的一个切片。上的一个切片。 4.3.2 常用的常用的多维分析多维分析操作操作 例如:(地区,时间,产品,销售额)例如:(地区,时间,产品,销售额)在时间维上选定一个维成员(设为在时间维上选定一个维成员(设为1997年年1 月)月)在时间维上的一个切片在时间维上的一个切片这样切片的数目取决于时间维上维成员的个数。这

20、样切片的数目取决于时间维上维成员的个数。 按照定义按照定义1,一次切片一定使原来维数减,一次切片一定使原来维数减1,所以所,所以所得的切片并不一定是二维的平面得的切片并不一定是二维的平面 4.3.2 常用的常用的多维分析多维分析操作操作 定义定义2:选定多维数组的一个二维子集的动作叫选定多维数组的一个二维子集的动作叫作切片,多维数组(维作切片,多维数组(维1,维,维2,,维维n,变量)变量)在维在维i和维和维j取某一区间或任意维成员,而将其余取某一区间或任意维成员,而将其余的维都取定一个维成员,则得到的就是多维数组的维都取定一个维成员,则得到的就是多维数组在维在维i和维和维j上一个二维子集,我

21、们称这个二维子上一个二维子集,我们称这个二维子集为多维数组在维集为多维数组在维i和维和维j上的一个切片,表示为上的一个切片,表示为(维(维i,维维j,变量)。变量)。 4.3.2 常用的常用的多维分析多维分析操作操作 1997年1月 产品销售情况时间维地区维产品维产品维地区维 产品 销售情况选定两个维:产品维和地区维数据切片数据切片 图图4-9 切片切片 选定时间维的维成员选定时间维的维成员1997年年1月月4.3.2 常用的常用的多维分析多维分析操作操作 按照定义按照定义2,不管原来的维数有多少,数据切片的,不管原来的维数有多少,数据切片的结果一定是一个二维的平面结果一定是一个二维的平面 从

22、定义从定义2可以得出两点:可以得出两点: 一个多维数组的切片最终是由该数组中除切片所一个多维数组的切片最终是由该数组中除切片所在平面的两个维之外的其它维的成员值确定的。在平面的两个维之外的其它维的成员值确定的。如图如图6-2中,切片由时间维的取值决定中,切片由时间维的取值决定即取时间维成员即取时间维成员1997年年1 月确定一个切片月确定一个切片取时间维成员取时间维成员1997年年2 月则可以确定另一个切月则可以确定另一个切片。片。 4.3.2 常用的常用的多维分析多维分析操作操作 维是观察数据的角度,那么切片的作用或结果就维是观察数据的角度,那么切片的作用或结果就是舍弃一些观察角度,使人们能

23、在两个维上集中观是舍弃一些观察角度,使人们能在两个维上集中观察数据察数据 对于维数较多的多维数据空间,数据切片是十分有对于维数较多的多维数据空间,数据切片是十分有意义的意义的 切片的这两个定义联系:切片的这两个定义联系:对于一个对于一个n维数组,按定义维数组,按定义1进行的进行的n-2 切片的结果,切片的结果,就必定对应于按定义就必定对应于按定义2进行的某一次切片的结果。进行的某一次切片的结果。 4.3.2 常用的常用的多维分析多维分析操作操作 二、切块二、切块(Dice)定义定义1:在多维数组的某一维上选定某一区间的维在多维数组的某一维上选定某一区间的维成员的动作称为切块,即限制多维数组的某

24、一维成员的动作称为切块,即限制多维数组的某一维的取值区间。显然,当这一区间只取一个维成员的取值区间。显然,当这一区间只取一个维成员时,即得到一个切片(定义时,即得到一个切片(定义1)。)。4.3.2 常用的常用的多维分析多维分析操作操作 6.1 从从OLTP到到OLAP 定义定义2:选定多维数组的一个三维子集的动作称为选定多维数组的一个三维子集的动作称为切块。即选定多维数组(维切块。即选定多维数组(维1,维,维2,,维维n,变量)变量)中的三个维:维中的三个维:维i、维维j和维和维r,在这三个维上取某在这三个维上取某一区间或任意的维成员,而将其余的维都取定一一区间或任意的维成员,而将其余的维都

25、取定一个维成员,则得到的就是多维数组在维个维成员,则得到的就是多维数组在维i、维维j和维和维r上一个三维子集,我们称这个三维子集为多维数上一个三维子集,我们称这个三维子集为多维数组在维组在维i、维维j和维和维r上的一个切块,表示为(维上的一个切块,表示为(维i,维维j,维维r,变量)变量)切块与切片的作用与目的是相似的切块与切片的作用与目的是相似的切块由多个切片叠合起来切块由多个切片叠合起来 6.1 从从OLTP到到OLAP 切块由多个切片叠合起来切块由多个切片叠合起来如果将时间维上的取值设定为一个区间(例如如果将时间维上的取值设定为一个区间(例如取取1997年年1月至月至1997年年10月)

26、,就得到一个月),就得到一个数据切块数据切块它由它由1997年年1月至月至1997年年10月的十个切片叠合而月的十个切片叠合而成成 4.3.2 常用的常用的多维分析多维分析操作操作三、三、旋转(旋转( Rotate )定义:改变数据方体维的次序的动作成为旋转定义:改变数据方体维的次序的动作成为旋转旋转操作并不对数据进行任何改变,只是改变我们旋转操作并不对数据进行任何改变,只是改变我们观察数据的角度。观察数据的角度。 时间维时间维产产品品维维产品维产品维时时间间维维 行列交换行列交换(a) 将某行维将某行维 换向列维换向列维 地区地区 北京北京 上海上海 地区地区 北京北京 上海上海 时间时间

27、产品产品 销售量销售量 销售量销售量 时间时间 第一季度第一季度 第二季度第二季度 . 产品产品 第一季度第一季度 : 第二季度第二季度 : (b) : : :4.3.2 常用的常用的多维分析多维分析操作操作 图图4-10: 旋转旋转地区维地区维时间维时间维产产品品维维产品维产品维时间维时间维地地区区维维 旋转以改变旋转以改变 页面显示页面显示 (c)OLAP的多维数据的位置:的多维数据的位置:1. 作为数据仓库的一部分作为数据仓库的一部分2. 作为数据仓库工具层的一部分作为数据仓库工具层的一部分4.3.2 常用的常用的多维分析多维分析操作操作 4.3.2 常用的常用的多维分析多维分析操作操作

28、四、四、下钻(下钻(drill down)下钻操作是指在某个分析的过程中,我们可能需要下钻操作是指在某个分析的过程中,我们可能需要从更多的维或者某个维的更细的层次上来观察数据,从更多的维或者某个维的更细的层次上来观察数据,这时我们可以通过下钻操作来进行更深入的分析。这时我们可以通过下钻操作来进行更深入的分析。下钻操作分为两种类型下钻操作分为两种类型:1.在现有的维上钻取到更细一层的数据在现有的维上钻取到更细一层的数据2.增加更多的维增加更多的维 4.3.2 常用的常用的多维分析多维分析操作操作 4.3.2 常用的常用的多维分析多维分析操作操作五、五、上卷(上卷(roll up)上卷操作是与下钻

29、操作相反的操作类型。下钻操作上卷操作是与下钻操作相反的操作类型。下钻操作是为了看到更细的数据,而上卷操作是为了看到更是为了看到更细的数据,而上卷操作是为了看到更粗的数据。粗的数据。上卷操作也分为两种类型上卷操作也分为两种类型:1.上卷到现有的某个维的更高层次去进行分析上卷到现有的某个维的更高层次去进行分析2.减少一个维来进行分析。减少一个维来进行分析。 4.3.3 其他的其他的多维分析多维分析操作操作一、维操作一、维操作维是多维数据模型中的核心概念之一。一个维中又维是多维数据模型中的核心概念之一。一个维中又包含有层次、层和成员等。对维的各个元素的表示包含有层次、层和成员等。对维的各个元素的表示

30、有很多方法。由于维中有层次、层和成员等元素,有很多方法。由于维中有层次、层和成员等元素,它们构成了一个层次结构。一个简单直观的表示法它们构成了一个层次结构。一个简单直观的表示法是点表示法,即按照它们在层次中的位置,用点把是点表示法,即按照它们在层次中的位置,用点把它们的名字连接起来。它们的名字连接起来。 4.3.3 其他的其他的多维分析多维分析操作操作维维操作可归为以下几类:操作可归为以下几类:1. 给定维标识求维名字;给定维名字求维标识;求一个维中给定维标识求维名字;给定维名字求维标识;求一个维中成员的个数。成员的个数。2. 给定层次的标识或名,求出层次中的所有层。给定层次的标识或名,求出层

31、次中的所有层。3. 给定层标识或名字,求层中成员的个数;求出层中所有的给定层标识或名字,求层中成员的个数;求出层中所有的成员;求出层所属的层次;求出层的上级层或下级层。成员;求出层所属的层次;求出层的上级层或下级层。4. 给定成员,求出它在成员关系图中的所有子女成员;求它给定成员,求出它在成员关系图中的所有子女成员;求它在某层上的所有后裔;求它的所有后裔;求出它的父亲成员;在某层上的所有后裔;求它的所有后裔;求出它的父亲成员;求它在某层上的所有祖先;求它的所有祖先。求它在某层上的所有祖先;求它的所有祖先。5. 给定成员,求出在某层中它的兄弟成员。给定成员,求出在某层中它的兄弟成员。 4.3.3

32、 其他的其他的多维分析多维分析操作操作Eg: 求求“2月份月份”的父成员:的父成员:时间时间.年年.季度季度.月月.2月月份份.parent,得到的结果是:,得到的结果是:时间时间.年年.季度季度.第第1季度。这季度。这里的里的parent是操作符。是操作符。 4.3.3 其他的其他的多维分析多维分析操作操作二、属性操作二、属性操作成员除了有名字外,还可以有属性用以说明各自的成员除了有名字外,还可以有属性用以说明各自的特征。成员属性丰富了多维数据分析。特征。成员属性丰富了多维数据分析。 4.3.3 其他的其他的多维分析多维分析操作操作表表4.5 商品维的信息商品维的信息表表4.6 商店维的信息

33、商店维的信息 4.3.3 其他的其他的多维分析多维分析操作操作(a)层次分析)层次分析(b) 特征分析特征分析 4.3.4 聚集的一些限制聚集的一些限制一、计算公式一、计算公式(1)公式的定义可以是显式的,也可以是隐式的)公式的定义可以是显式的,也可以是隐式的(2)公式的定义需要指定适用范围)公式的定义需要指定适用范围(3)多个公式作用于同一个数据单元时,需要指)多个公式作用于同一个数据单元时,需要指定优先级定优先级:(a)求和求和(b)求和与比值求和与比值 4.3.4 聚集的一些限制聚集的一些限制二、可汇总性二、可汇总性两个相邻层之间必须满足一定的条件,才可以进行上两个相邻层之间必须满足一定

34、的条件,才可以进行上述的聚集计算。这些条件包括:述的聚集计算。这些条件包括:1. 分离性:分离性:L2中的任何一个成员只能是中的任何一个成员只能是L1中某一个成中某一个成员的子女,不能是两个或两个以上成员的子女。员的子女,不能是两个或两个以上成员的子女。2. 完全性:完全性:L2中的任何一个成员必须是中的任何一个成员必须是L1中某一个成中某一个成员的子女,员的子女,L1中的任何一个成员必须在中的任何一个成员必须在 L2中有至少一中有至少一个子女。个子女。3. 兼容性:度量必须是可累计型,聚集函数不能是整兼容性:度量必须是可累计型,聚集函数不能是整体型函数,只能是分布型或代数型函数。体型函数,只

35、能是分布型或代数型函数。 4.3.4 聚集的一些限制聚集的一些限制 4.3.5 水平层次结构和非水平层次结构水平层次结构和非水平层次结构前面介绍的时间维和地区维是一种简单的、有良好前面介绍的时间维和地区维是一种简单的、有良好特性的维,构成它们层次的层之间有线性关系,相特性的维,构成它们层次的层之间有线性关系,相邻层之间满足可汇总性邻层之间满足可汇总性,我们把这样的维层次叫做我们把这样的维层次叫做水平维层次水平维层次。除此之外还有其他类型的维层次。除此之外还有其他类型的维层次。一般的,如果在成员关系图中,从根结点到任何一一般的,如果在成员关系图中,从根结点到任何一个叶子结点的路径长度相同,并且每

36、个成员的父结个叶子结点的路径长度相同,并且每个成员的父结点属于成员所在层的上一层的成员。我们把这样的点属于成员所在层的上一层的成员。我们把这样的层次结构叫做水平层次结构,该结构具有良好的可层次结构叫做水平层次结构,该结构具有良好的可汇总性。汇总性。 4.3.5 水平层次结构和非水平层次结构水平层次结构和非水平层次结构 4.3.5 水平层次结构和非水平层次结构水平层次结构和非水平层次结构 4.4 多维多维查询语言查询语言OLE DB for OLAP是是OLE DB中定义的用于访问多中定义的用于访问多维数据的接口,它独立于多维数据的具体存储结构,维数据的接口,它独立于多维数据的具体存储结构,任何

37、关系或多维的数据提供者均可以使用这套接口任何关系或多维的数据提供者均可以使用这套接口将多维数据描述或者表达给最终用户使用。将多维数据描述或者表达给最终用户使用。MDX是是OLE DB for OLAP接口规范中定义的一组接口规范中定义的一组用于对多维数据进行查询的语句,类似于关系数据用于对多维数据进行查询的语句,类似于关系数据库中的标准库中的标准SQL语句。创建语句。创建MDX的主要目的是为了的主要目的是为了方便用户对多维数据进行访问。方便用户对多维数据进行访问。 4.4.1 MDX简介简介MDX语言和语言和SQL语言一样,语句具有语言一样,语句具有SELECT、FROM和和WHERE结构。但

38、是结构。但是MDX语言采用其他的关键字来查询数据语言采用其他的关键字来查询数据方体,返回可以进一步加以分析的数据,并提供了可以对返方体,返回可以进一步加以分析的数据,并提供了可以对返回的数据进行操作的相应的函数。而且,回的数据进行操作的相应的函数。而且,MDX语言增强了用语言增强了用户自定义函数的功能,可以扩展或者定制用户某些特殊的商户自定义函数的功能,可以扩展或者定制用户某些特殊的商业需求。业需求。MDX语言所提供的数据定义语言语言所提供的数据定义语言(DDL)也和也和SQL类似。类似。SQL的数据定义语言的数据定义语言/操纵语言都是返回或操纵两维的数据,操纵语言都是返回或操纵两维的数据,而

39、而MDX用来返回或操纵多维的数据用来返回或操纵多维的数据,采用一套坐标系统来对采用一套坐标系统来对它们进行定义。它们进行定义。 4.4.1 MDX简介简介 4.4.1 MDX简介简介一条一条MDX语句至少包含以下几个部分:语句至少包含以下几个部分:查询所涉及的数据方体查询所涉及的数据方体产生的结果数据集合中轴的个数产生的结果数据集合中轴的个数数据方体的维与结果数据集合中轴的对应关系数据方体的维与结果数据集合中轴的对应关系每个维上所要查询的成员每个维上所要查询的成员 4.4.1 MDX简介简介SELECT (TV,Qtr1),(TV,Qtr2.Apr),SELECT (TV,Qtr1),(TV,

40、Qtr2.Apr),(Clothes.Shirt,Qtr1) ,(Clothes.Shirt,Qtr1) ,(Clothes.Shirt,Qtr2) ON COLUMNS(Clothes.Shirt,Qtr2) ON COLUMNSBeijing, ShanghaiBeijing, ShanghaiON ROWSON ROWSFROMFROMSALESCUBESALESCUBEWHEREWHERESales Sales 4.4.1 MDX简介简介 4.4.2 MDX对象模型对象模型MDX查询语言采用一套以元组为单位的坐标系统来定义所要查询语言采用一套以元组为单位的坐标系统来定义所要的数据集合。

41、一个的数据集合。一个MDX查询可能包含有多个轴,每个轴上查询可能包含有多个轴,每个轴上又会有多个维,每个维上用户又可以选择若干个维成员。又会有多个维,每个维上用户又可以选择若干个维成员。 系统内部处理的各种对象类型系统内部处理的各种对象类型: 查询对象:用来描述用户的查询信息查询对象:用来描述用户的查询信息 轴对象:描述查询中的一个轴的信息轴对象:描述查询中的一个轴的信息 嵌套维对象:描述处在某个轴上的某个维的信息嵌套维对象:描述处在某个轴上的某个维的信息 成员查询对象:查询所涉及的某一轴的某一维上的所有成成员查询对象:查询所涉及的某一轴的某一维上的所有成员的集合。员的集合。 轴序列对象:描述

42、某个轴上由各个嵌套维中的成员组合而轴序列对象:描述某个轴上由各个嵌套维中的成员组合而成的轴坐标的信息,是一个数组,其中的每个数据元素对成的轴坐标的信息,是一个数组,其中的每个数据元素对应一个元组,即对应该轴上的一个坐标点。应一个元组,即对应该轴上的一个坐标点。 4.5.1 三维数据展示三维数据展示三维数据的展示要解决两个问题:一是某个具体的三维数据的展示要解决两个问题:一是某个具体的维安排在空间中的哪个方向,二是如何展示维层次。维安排在空间中的哪个方向,二是如何展示维层次。 核心思想之一是核心思想之一是“切片切片”,即将三维数据沿,即将三维数据沿Z轴切轴切片,每一个坐标单位切一片,将切片的片,

43、每一个坐标单位切一片,将切片的X轴,轴,Y轴轴在计算机屏幕的水平和垂直方向展示,在计算机屏幕的水平和垂直方向展示,Z轴的坐标轴的坐标值用一个点表示。值用一个点表示。 核心思想之二是核心思想之二是“嵌套嵌套”,按照层的抽象程度,按照层的抽象程度,依次在水平或垂直方向排列。依次在水平或垂直方向排列。 4.5.1 三维数据展示三维数据展示从表图从表图4.10中可以看出,我们对地区维进行了切片,地区中可以看出,我们对地区维进行了切片,地区维只给出了一个成员,即北京。时间维和商品维分别被安维只给出了一个成员,即北京。时间维和商品维分别被安排在垂直方向和水平方向。另外,利用嵌套的方法,时间排在垂直方向和水

44、平方向。另外,利用嵌套的方法,时间维展示出了年和季度两个层,商品维给出了商品大类和具维展示出了年和季度两个层,商品维给出了商品大类和具体商品两个层。体商品两个层。 4.5.2 高维数据展示高维数据展示展示高于三维的数据要解决的关键问题是如何安排展示高于三维的数据要解决的关键问题是如何安排其它的维。其它的维。答案是只能安排在水平或者垂直方向,用嵌套的方答案是只能安排在水平或者垂直方向,用嵌套的方法在水平或垂直方向表示多个维。法在水平或垂直方向表示多个维。 4.5.2 高维数据展示高维数据展示 4.5.2 高维数据展示高维数据展示 4.5.2 高维数据展示高维数据展示比较表比较表4.11和表和表4

45、.12可以发现,采用切片和嵌套的可以发现,采用切片和嵌套的方法表示多维数据,高维的情形不如三维的效果清方法表示多维数据,高维的情形不如三维的效果清晰。因为,我们既用嵌套表示同一个维的不同层晰。因为,我们既用嵌套表示同一个维的不同层(例如时间维的年和季度(例如时间维的年和季度2层),也表示两个相邻层),也表示两个相邻的维(时间维和场景维),具有二义性。在分析过的维(时间维和场景维),具有二义性。在分析过程中,需要仔细区分才能知道相邻数据的关系。程中,需要仔细区分才能知道相邻数据的关系。 介绍了联机分析处理技术的一些基本概念及其基本内介绍了联机分析处理技术的一些基本概念及其基本内容。重点对多维数据模型进行了介绍。容。重点对多维数据模型进行了介绍。 把握以下几点把握以下几点:掌握什么是掌握什么是OLAP,以及主要特点。,以及主要特点。OLAP与与OLTP的区别。的区别。掌握什么是维、维成员、维层、维层次。理解三种掌握什么是维、维成员、维层、维层次。理解三种不同的多维数据模型之间的区别与联系。不同的多维数据模型之间的区别与联系。了解聚集的概念以及进行聚集计算时的一些限制条了解聚集的概念以及进行聚集计算时的一些限制条件。件。了解多维查询语言了解多维查询语言MDX及其对象模型,初步了解及其对象模型,初步了解多维数据的展示方法。多维数据的展示方法。小小 结结

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com