1、满足业务需求,项目管理 (方法论,维持元数据),定义 数据仓库的概念 及术语,规划成功的 数据仓库,分析用户 查询需求,选择处理 体系,建模数据仓库,规划数据仓库 存储,总述,ETl (构建数据仓库 ),满足业务 需求,支持终端 用户访问,管理数据仓库,目标,完成这次课后,要求能够完成以下几点: 描述为何一个联机事务处理体系 (OLTP) 不适合复杂事务分析 描述决策支持查询如何提炼出来以引导当前使用的数据仓库解决方案 解释为什么业务被应用数据仓库技术所驱动 识别一些采用了数据仓库技术的产业,OLTP 系统特性,特性 OLTP 典型操作 经常更新 分析需求的水平 低 屏幕 不变的 数据处理数量
2、 一次性处理的数据量少 数据水平 细节性数据 数据时间 当前数据 面向主题的 操作人员,为什么 OLTP 不适何复杂事务分析,复杂分析 分析历史数据信息综合性数据 数据库设计 : 规格化, 计划制定,OLTP 支持日常服务的信息数据存储在事务级别数据库设计:规格化,管理信息系统及决策支持,操作报告,决策者,生产平台,管理信息系统提供业务数据 报告根据需求发布 报告提供很少的分析功能 决策支持工具为个人提供专门的数据访问通路,专门访问,分析来自操作系统的数据,数据结构复杂 系统被设计以高性能的吞吐量为目标 数据没有专门的代表意义 数据是分散的 联机事务处理可能不适合实时查询,操作报告,生产平台,
3、最终用户处理从运行环境中遗留下的数据 用户自身的数据,数据处理过程,处理,操作系统,决策者,管理发布,处理过程,处理,操作系统,决策者,生产力发布,双重努力 多倍技术 陈旧的报告 没有元数据,数据质量发布,没有共同的实践依据 不同的计算算法 不同的抽取级别 不同的粒度级别 不同的数据字段名 不同的数据字段含义 缺少信息 没有数据修正规则 没有操练下来的能力,从处理到仓库动态支持系统,受约束的 可靠的 质量信息 数据单一来源,数据仓库,内在的和外部的系统,决策者,数据仓库处理环境的优势,没有做重复努力 许多技术不需要工具支持 数据,含义及表述方面没有不一致 没有时间段冲突 没有算法混乱 没有操练
4、下来的限定,商业因素,了解商业 重新面临新的挑战 产品投资 消费者投资 保留消费者 技术投资 改善对业务信息的访问 有利可图的 提供较好的服务及产品,商业因素,提供信息支持系统 获取质量信息 减少成本 使业务成流线型 增加利润,技术改进,并行 硬件 操作系统 数据库 查询 索引 应用,大数据库 64位体系结构 索引技术 提供有成本效益的开放式系统 充足的仓库工具 久经考验的终端用户工具,现状及发展,项目发展,当前的收入,发展驱动因素及抑制因素,成功的实施 减少风险 充足的处理软件 通过价格比率提高业绩 进行全体人员的培训 服从千年虫问题 技术缺乏 缺乏综合的元数据 数据更新的成本高,数据仓库的典型应用,航空 银行 医疗 投资 保险,零售业 电讯业 制造业 信用商 制衣商,小结,这节课包含了下列几项主要内容: 描述为何一个联机事务处理体系 (OLTP) 不适合复杂事务分析 描述决策支持查询如何提炼出来以引导当前使用的数据仓库解决方案 解释为什么业务被应用数据仓库技术所驱动 识别一些采用了数据仓库技术的产业,实践 2-1 总述,实践包含了对应的问题和答案,以及讨论了数据仓库技术如何满足业务需求这一问题。,