1、通过方法学驱动执行,总述,管理项目(方法论,维持元数据),定义数据仓库的 概念及术语,规划成功的 数据仓库,分析用户 查询需求,选择处理 体系结构,建模数据仓库,计划数据 仓库存储,ETT (构建数据仓库),满足业务需求,支持终端 用户访问,管理数据仓库,目标,在完成本次课后,应能做到以下几点: 阐述不同的数据仓库开发方法以及这些方法所带来的好处 确定Oracle 方法的目标 讨论Oracle数据仓库方法的目的及基本内容 确定作为一系列进程和途径的数据仓库方法 讨论Oracle 数据仓库技术的初始目标,“大爆炸” 方法,分析企业需求,创建企业数据仓库,存储于子集中或数据集市 中的报告,“大爆炸
2、” 方法: 优点及缺点,优点: 真正的优势在于数据仓库作为一个主要项目被创建,比如业务流程再设计,它们之间相互依赖着对方 在数据仓库项目开始之前有一个大局的数据仓库 缺点: 涉及高风险, 消耗时间长 需要改变需求所带来的的运行风险。,数据仓库开发的渐进方法,反复重复 更短时间的实施 确认每一个阶段,渐进方法的好处,通过努力开发循序渐进的方法交付一个战略性的数据仓库上解决方案 提供可扩展的,可升级的体系结构 支持企业组织的信息需求 快速提供商业利益以及确保更快的投资收益 允许数据仓库每次基于一个主题或者应用领域而创建 允许构造一个综合的数据集市环境,行销,自顶向下的方法,历史数据,操作数据,外部
3、数据资源,销售,数据仓库,数据集市,用户,自顶向下的方法: 优点及缺点,优点: 提供一个相对的快速实施及响应操作 使风险降到最低 强调高级别的业务需求 在主题领域完成很好的配合 缺点: 预先投资必须增加 定义分界点困难 除非客户需要交叉功能的报告,否则将不适合,自底向上的方法,历史数据,操作数据,外部数据来源,数据仓库,数据集市,自底向上方法: 优点及缺点,优点: 对IT 有吸引力 更容易从 IT获得 缺点: 需要源系统包括当前业务进程 在交货前设计可能过时 对每一个增量都需要业务流程再设计 下一个相关处理过程的解决方法可能被否决 给商业带来的全部利益将会被减到最小,Oracle 方法,组成:
4、 联机指导方针及指南 工作计划模版 可交付的模版 通过经验和基于估计, 管理, 发展, 以及交付业务解决方案来创建,Oracle 数据仓库方法,通过开发引导: 业务功能 过程 任务 模仿传统习惯的开发方法,方法资源,软件工具,工作计划模版* 可交付的模版* 在线手册 评估软件*无产品可利用,手册,方法手册 进程及任务参考 可交付参考*,Oracle 数据仓库方法,集中范围 风险管理 依靠各地用户参与 给予一个可扩展的、可升级的解决方案 使用的技术多样性 确定任务具有明确的目标和可交付性 采用一般的技术、方法及依据 把任务分配给每一个过程,把过程分配给每一个阶段,效益,DWM 基本原理,方式 阶
5、段 过程 任务与交付 角色,阶段 1,阶段 2,阶段 3,阶段 1 任务1 阶段 1 任务2 阶段 1 任务3,阶段 3 任务1 阶段 3 任务2 阶段 3 任务3,阶段 2 任务1 阶段 2 任务2 阶段 2 任务3,过程 1,过程 2,方法,循序渐进的,封装于数据集市,仓库,数据集市,数据集市,数据集市,仓库基础设施执行,商业应用执行,渐进概念的证明I,获取需求,渐进方式,商业策略,IT 策略,仓库策略阶段,范围服务,技术体系结构上的服务,仓库基础设施服务,仓库商业解决方案服务,渐进 1,渐进 2,渐进 3,渐进 n,渐进 A,渐进 B,渐进 C,渐进 z,概念证明,渐进的开发,集中于业务
6、功能 提供最佳的企业受益 适合仓库演变 一旦一个渐进已经完成,则下一个渐进的选择和范围将会被确定 每一次渐进遵循着相同的阶段次序,策略,渐进的开发,策略阶段,策略,业务需求,数据获取,体系结构,数据质量,经营管理,策略,定义,分析,设计,构造,转换,策略阶段,策略,元数据,数据访问,文档,测试,培训,策略,定义,分析,设计,构造,转换,定义阶段,定义,业务需求,数据获取,体系结构,数据质量,策略,定义,分析,设计,构造,转换,定义阶段,定义,管理,元数据管理,数据访问,文档,策略,定义,分析,设计,构造,转换,培训,分析阶段,分析,业务需求,数据获取,体系结构,数据质量,管理,策略,定义,分析
7、,设计,构造,转换,分析阶段,分析,元数据,数据访问,文档,测试,培训,策略,定义,分析,设计,构造,转换,设计阶段,数据获取,体系结构,数据质量,管理,设计,元数据管理,策略,定义,分析,设计,构造,转换,设计阶段,设计,策略,定义,分析,设计,构造,转换,构造阶段,数据获取,体系结构,数据质量,管理,构造,元数据管理,测略,定义,分析,设计,构造,转换,构造阶段,构造,测略,定义,分析,设计,构造,转换,转换到生产阶段,测试,训练,转换,传送实施支持,转换到生产,策略,定义,分析,设计,构造,转换,数据获取,探索阶段,传送-实施支持,发现,测试,定义,分析,设计,构造,转换,发现,过 程,
8、一套达到目标的连贯的任务 一般的技能设置 可交付的项目大多数重叠且相互关联; 其它的则是严格地继承,过 程,业务需求定义 数据获取 体系结构 数据质量 仓库管理 元数据管理 数据访问 数据库设计及构造 文件 测试 培训 转换 发送-执行支持,业务需求定义,定义需求 阐明范围 建立执行通路图 提供企业执行初始重点 确定信息需求 需求模型,数据获取,识别, 抽取, 转换, 及迁移资源数据 考虑内部和外部数据 在源数据和目标数据之间转移 在源数据和目标数据库对象之间完成缺口分析 定义初始载入及刷新策略 定义需求工具 创建, 测试, 以及执行数据获取模式,体系结构,专门的技术基础 创建仓库体系构思 为
9、提供可扩展性和灵活性整合产品的结构组件 确定数据库环境分布式的或集中式的 定义开发, 测试,培训, 以及生产环境 配置平台 控制数据库大小 考虑磁盘条带集,数据质量,确保数据一致性,可靠性及准确性 开发一个策略: 清理功能 整合功能 质量管理程序 确定业务规则: 清理功能 错误控制 审核及控制 确定数据质量的工具需求 创建, 测试, 及执行数据质量模 块,仓库管理,具体的维护策略: 配置管理 仓库管理 数据控制 定义仓库管理平台及需求工具 创建, 测试, 以及执行单元 提供数据权限的管理及监视 自动化仓库管理任务,元数据管理,定义元数据策略 定义元数据类型 元数据的存储,整合及访问权限的具体要
10、求 建立元数据的技术和业务观点 开发获取、衔 接及访问元数据的模 块,数据访问,确定,选择, 和设计用户访问工具 定义用户框架 确定所需接口的风格, 查询, 报告, 及终端用户层 评价,获得 ,以及安装访问工具 设计和开发数据访问对象 查询并报告 分类 层次及尺度,数据库创建及设计,支持数据需求 提供有效的访问权限 创建、验证逻辑和物理模型 创建关系和多维数据库对象 估计分区,分段及分片 确定索引及键 生成数据定义语言 创建及执行数据库对象,文档资料,产生可交付使用的文档: 术语表 使用及技术手册 联机帮助 元数据参考指南 仓库管理参考 新特性指导,测 试,制定测试策略 创建测试计划,脚本及环
11、 境 测试所有组 件 数据获取 数据访问 专用通路 失效 集成 备份 恢复 支持 验 收 测试,培 训,定义需求: 技术上 最终用户 商业上 确定工作人员接受培训 建立时间框架 设计及开发 原 始资料 注重利用工具来使用数据仓库,转 换,为转换到生产仓库确定任务 迁移模块及程序 制定安装计划 维护环境准备 生产环境准备,实现后的支持,审查及评估仓库的使用 监控仓库的使用 更新仓库 监测及响应问题 进行性能的测试及调试 转移责任 评估和审查实施方案,任务与交付,工作细分结构概述 组织的过程和阶段,角 色,项目工作组: 角色及责任 一般角色业务分 析 人员, 数据库管理者,开发人员, 测试人员 仓
12、库特别角色数据仓库建模人员, 元数据建模员, 数据质量管理员, 数据仓库管理员,仓库技术倡议,消费者驱动 仅限于仓库产品 注重质量而不是数量 高水平的合作伙伴 需求 Oracle 认证的合作伙伴解决水平 产品认证 参考文 献,WTI 分类合伙人,设计及管理 资源 管理 访问 数据内容提供者,总 结,这次课讨论了以下几个主题: 阐述不同的数据仓库开发方法以及这些方法所带来的好处确定Oracle 方法的目标讨论Oracle数据仓库方法的目的及基本内容确定一系列程序及过程的数据仓库方法讨论Oracle 数据仓库技术的初始目标,实践 4-1 总述,实践包含以下几项内容:定义一个假想的企业的业务需求, 包含数据仓库的目的、目标及策略通过讨论发现在数据仓库项目执行过程 中一些可能的问题及挑战,