1、定义数据仓库的概念及术语,概述,Project Management (Methodology, Maintaining Metadata),定义 数据仓库 的概念及术语,Planning for a Successful Warehouse,Analyzing User Query Needs,Choosing a Computing Architecture,Modeling the Data Warehouse,Planning Warehouse Storage,ETT (Building the Warehouse),Supporting End User Access,管理数据仓库
2、,项目管理 (方法论,维持元数据),规划成功的 数据仓库,分析用户 查询需求,选择处理 体系结构,建模数据仓库,计划数据仓库 存储,ETT (构建数据仓库 ),支持终端 用户访问,满足业务需求,目标,完成这次课后,应该能够做到以下几点: 明确一般的,可被广泛接受的数据仓库的定义 明确数据仓库的一些操作属性 明确数据仓库的基本术语 明确为使数据仓库技术成功实施,各个需求部分联合起来的功能 识别和明确 Oracle 数据仓库的愿景、产品和服务,数据仓库技术的定义,“一个企业的结构库里存放着面向主题的,随时间变化的,历史性的数据用于信息检索和决策支持。数据仓库存储原子和汇总的数据。”,Oracle
3、数据仓库方法,数据仓库特征,面向主题,集成的,随时间变化的,非易失的,数据仓库,数据根据业务方向加以分类和存储而不是根据它的应用,面向主题的,联机事务处理的应用,消费者财务 信息,数据仓库课题,公平的 计划,共享,保险,贷款,储蓄,集成的,数据仓库,联机事务处理应用,在给出的主题中数据被定义和存储一次。,当前账目,贷款,消费者,随时间变化,01/97,02/97,03/97,一月,二月,三月,数据仓库,时间,数据,数据被作为一系列的“快照”来存储,每一个代表一个时间段。,非易失性,在数据仓库中的典型数据不能被更新或删除,仓库,读取,插入 读取 更新 删除,载入,操作,数据改变,操作数据库,第一
4、次载入,刷新,刷新,刷新,清除或存档,数据仓库与联机事务处理的比较,性质 响应时间 操作 数据性质 数据结构 大小 数据来源 行为,数据仓库 秒到小时 基本上只读 随时间推移的快照 条件, 时间 由大到很大 操作的, 内在的 分析,操作 次秒到秒 DML 30-60 天 应用 由小到大 操作的,内在的 处理,使用规律,操作系统是可预知的 数据仓库 可变的 随意的,对用户的期望,控制期望值 为查询响应制定可行的目标 设置 SLAs 培训 改进及使用指数,企业级数据仓库,大规模实施 全部业务领域 来自所有的学科领域的数据 循序渐进的开发 企业级数据的单一来源 企业级数据的同步 指向所依赖的数据集市
5、的单一发布,数据仓库与数据集市的比较,数据集市 部门 单一主题, LOB 少 100 GB 月,数据仓库,性质 范围 主题 数据来源 大小 (典型) 执行时间,数据仓库 企业 多样的 多 100 GB to 1 TB 月年,依靠数据集市,数据仓库,数据集市,外部数据,文件平台,操作系统,出售,财政,独立于数据集市,销售或营销,外部数据,文件平台,操作系统,数据仓库术语,用于操作的数据的存储 (ODS)列出生产系统存储技术的面向主题的,集成的数据的操作需求元数据,元数据,数据仓库术语,体系结构,企业级数据仓库,业务数据区域,源数据,数据集成,方法学,确保一个成功的数据仓库 鼓励循序渐进地开发 对
6、企业级数据仓库提供一个阶段性方法 安全 易管理的 可被证明的 可被推荐的,建模,仓库不同于业务结构: 分析需求 面向主题 数据必须符合面向主题的信息: 明确业务主题 定义主题之间的关系 命名每个主题的属性 建模是一个迭代的过程 可使用建模工具,抽取,转换和迁移,购买专门的工具或者开发程序 抽取使用不同的方法选择数据 转换验证,清理,整合,时间戳数据 迁移将数据移入数据仓库,联机事务处理数据库,分段文件,数据库仓库,高效的数据库服务器和管理工具在数据管理的各个方面发挥作用 必须条件 多产的 柔性的 丰富的 可升级的 高效率的 硬件,操作系统和网络管理,数据管理,数据存取及发布,为业务分析检索数据
7、的工具 必须条件 容易使用 直觉上的 元数据 培训 更多的工具是必须的,数据库仓库,简单查询,预测,进一步深入,Oracle 数据仓库组成,关联的工具,应用/ Web,任何数据,任何通路,任何来源,外部数据,操作数据,联机事务处理工具,文本,图片,有关联的/ 多维的,空间的,音频, 视频,Web,Oracle 专用数据集市组,仓库引擎,数据建模 Oracle 数据集市设计,数据管理 Oracle 企业管理器,数据抽取 Oracle 数据集市创建,数据访问 & 分析发现 & Oracle报告,联机事务处理 引擎,联机事务处理 数据库,数据集市数 据库,Oracle8,SQL*PLUS,用Orac
8、le公司数据集市组进行数据市场的实现,Oracle 企业服务器 Oracle 企业管理器 Oracle 数据集市设计 Oracle 数据集市建造 Oracle 开发者 Oracle Web 应用服务器 Oracle 报告,Oracle 仓库构造的体系结构,Warehouse Builder,代码生成 元数据, 工作平台,元数据,来源,目标表,Oracle8i,PL/SQL, Java 转换,抽取 工具 加载 远程 SQL 网关 OLE-DB/ ODBC Mainframe Specialized ERP 数据 SAP Peoplesoft Oracle,Fi改变 过滤器,外部因素,PL/SQL
9、, Java Wrapper,转换驱动程序,Oracle 商业智能工具,IS开拓使用者的视野,Oracle 报告,当前的,商业用户,Oracle 开发,战术的,分析,Oracle 发布,战略的,每个任务的工具,Oracle 报告 按区域最后季度销售了什么?,Oracle 开发 什么使北美销售得到增长?,问题,Oracle 鉴于网络销售的快速增长,在剩下 发布 的日子里销售总额将会是多少?,任务,工具,生产报告,进一步分析,特别查询和分析,Oracle 仓库服务,Oracle 咨询,Oracle 教育,Oracle 支持的服务,消费者,总结,这次课包含以下几项主题: 明确一般的,可被广泛接受的数据仓库的定义 区分联机事务处理系统和分析系统的差异 定义一些常见的数据仓库术语 识别数据仓库中的元素和程序 识别和明确Oracle数据仓库的愿景、产品和服务,实践 3-1 概述,实践包含以下几项主题: 通过数据仓库的概念及术语回答问题 讨论数据仓库的一些概念及术语,