《OLAP介绍.ppt》由会员分享,可在线阅读,更多相关《OLAP介绍.ppt(39页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1数据仓库数据仓库、联机分联机分析处理和数据挖掘析处理和数据挖掘2一数据仓库的定义和特点一数据仓库的定义和特点二数据仓库的体系结构二数据仓库的体系结构三三OLAPOLAP概述概述四四OLAPOLAP的基本操作的基本操作五五OLAPOLAP的实现方法的实现方法六六.数据挖掘概述数据挖掘概述3数据仓库的数据仓库的定义和特点定义和特点4数数据据仓仓库库的的定定义义和和特特点点世 界 公 认 的 数 据 仓 库 概 念 创 始 人W.H.Inmon在数据仓库(Building the Data Warehouse)一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、非易失的(稳定性)、随时间变化
2、(不同时间)的数据集合,用以支持经营管理中的决策制定过程。5数数据据仓仓库库的的定定义义和和特特点点u数据仓库的特点面向主题的面向主题的集成的集成的随时间变化的随时间变化的非易失的非易失的数据仓库数据仓库6数数据据仓仓库库的的定定义义和和特特点点u面向主题的OLTP OLTP 应用应用应用应用客户财务信息客户财务信息数据仓库主题数据仓库主题数据仓库主题数据仓库主题资产资产股票股票保险保险贷款贷款储蓄储蓄8数数据据仓仓库库的的定定义义和和特特点点u集成的 数据仓库数据仓库数据仓库数据仓库OLTP OLTP 应用应用应用应用SavingsCurrent accountsLoansCustomer9
3、数数据据仓仓库库的的定定义义和和特特点点u集成的10数数据据仓仓库库的的定定义义和和特特点点u非易失的数据仓库数据仓库数据仓库数据仓库ReadReadInsert Insert ReadReadUpdateUpdateDeleteDeleteLoadLoadOLTPOLTP11数数据据仓仓库库的的定定义义和和特特点点u非易失的Operational DatabasesOperational DatabasesWarehouse DatabaseWarehouse DatabaseFirst time loadFirst time loadRefreshRefreshRefreshRefresh
4、RefreshRefreshPurge or ArchivePurge or Archive12数数据据仓仓库库的的定定义义和和特特点点u随时间变化的01/9702/9703/97JanuaryFebruaryMarch数据仓库数据仓库数据仓库数据仓库TimeData19971997199713数数据据仓仓库库的的定定义义和和特特点点u随时间变化的14数据仓库的数据仓库的体系结构体系结构15数数 据据 仓仓 库库 的的 体体 系系 结结 构构1.数据仓库的数据结构高度综合级轻度综合级当前细节级早期细节级集成转换DSS映射元数据DB分析工具数据仓库的多粒度数据组织16数数 据据 仓仓 库库 的的
5、 体体 系系 结结 构构2.数据仓库的体系结构多维数据OLAP工具相关数据集DM工具DBDBMSOLTPDWDWMS查询17OLAPOLAP概述概述18O O L L A A P P 概概 述述1.什么是OLAP?uOLAP是针对特定问题的联机数据访问和分析。u通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察19O O L L A A P P 概概 述述2.维(Dimension)u维是人们观察数据的特定角度。u例如,企业常常关心产品销售随着时间推移而产生的变化的情况
6、,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。u企业也常常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。20O O L L A A P P 概概 述述3.维的层次u人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这个描述方面为维的层次。u一个维往往具有多个层次,例如:u描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;u同样,城市、地区、国家就构成了一个地理维的多个层次。21O O L L A A P P 概概 述述
7、4.维成员u维的一个取值就称为该维的一个维成员。u如果一个维是多层次的,那么该维的维成员就是不同维层次的取值的组合。u例如,考虑时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到时间维的一个维成员,即“某年某月某日”。22O OL LA AP P概概述述5.OLTP与OLAP的差异23OLAPOLAP的的基本操作基本操作24O O L L A A P P的的 基基 本本 操操 作作u钻取:在一个维内部沿着层次从上到下或从下到上的方向考察数据u上钻(Drill up)u下钻(Drill down)u切片/切块(Slice and dice)固定某些维成员,对其它
8、维进行考察u旋转(Pivot,rotate)按不同顺序组织各个维,对结果进行考察25O O L L A A P P的的 基基 本本 操操 作作u一个OLAP操作实例:26O O L L A A P P的的 基基 本本 操操 作作u钻取(Dill up/Drill down):27O O L L A A P P的的 基基 本本 操操 作作u切片28O O L L A A P P的的 基基 本本 操操 作作u旋转按不同顺序组织各个维,对结果进行考察时间产品财务指标财务指标产品时间29OLAPOLAP的的实现方法实现方法30O O L L A A P P的的 实实 现现 方方 法法1.OLAP服务器
9、的实现方法u关系OLAP(ROLAP)u多维OLAP(MOLAP)u混合OLAP(HOLAP)OLAP ServerOLAP ServeruseruserWarehouseWarehouse?31O O L L A A P P的的 实实 现现 方方 法法2.OLAP服务器的特征u查询性能u空间占用u分析查询能力32O O L L A A P P的的 实实 现现 方方 法法uROLAP服务器的原理OLAP ServerOLAP ServeruseruserWarehouseWarehouseDataDatacachecacheLiveLivefetchfetchCacheCacheQueryQu
10、eryDataData33O O L L A A P P的的 实实 现现 方方 法法uMOLAP服务器的原理OLAP ServerOLAP ServeruseruserWarehouseWarehouseQueryQueryDataDataMDDBMDDBPeriodicPeriodicloadload34O O L L A A P P的的 实实 现现 方方 法法uHOLAP服务器的原理OLAP ServerOLAP ServeruseruserWarehouseWarehouseFetch,Fetch,cachecacheMDDB andMDDB andcachecachePeriodicP
11、eriodicloadloadQueryQueryDataData35数据挖掘概述数据挖掘概述36数数据据挖挖掘掘概概述述1.为什么需要数据挖掘?数据挖掘数据挖掘VLDB太多数据太多数据有价值的知识有价值的知识37数数据据挖挖掘掘概概述述2.数据挖掘的定义就是从大大量量的的、不不完完全全的的、有有噪噪声声的的、模模糊糊的的、随随机机的的数数据据中中,识识别别出出有有效效的的、新新颖颖的的、潜潜在在有有用用的的,以以及及最最终终可可理理解解的的模模式式(或或知知识识)的非平凡过程的非平凡过程。需要指出的是,这里所说的知识,不是放之四海而皆准的真理,而是相对的。38数数据据挖挖掘掘概概述述3.数据挖掘是多学科的交叉数据挖掘数据库技术统计学其他学科信息科学机器学习可视化39数数据据挖挖掘掘概概述述4.数据挖掘与数据仓库的关系u数据挖掘是数据仓库发展的必然结果u数据仓库为数据挖掘提供应用基础