收藏 分享(赏)

商业智能BI介绍.pdf

上传人:精品资料 文档编号:8997126 上传时间:2019-07-19 格式:PDF 页数:66 大小:1.95MB
下载 相关 举报
商业智能BI介绍.pdf_第1页
第1页 / 共66页
商业智能BI介绍.pdf_第2页
第2页 / 共66页
商业智能BI介绍.pdf_第3页
第3页 / 共66页
商业智能BI介绍.pdf_第4页
第4页 / 共66页
商业智能BI介绍.pdf_第5页
第5页 / 共66页
点击查看更多>>
资源描述

1、BI介绍内容 为什么需要 BI 什么是 BI BI的体系结构 如何实施 BI BI与大数据为什么需要 BIBI的意义 BI是把运营 数据转化成为高价值的可以获取的信息(或知识),并且在恰当的时候通过恰当的方式把恰当的信息传递给恰当的人数据 信息 知识 决策BI的价值响应能力 监视事件和计量标准 将最近事件和历史数据相关联分析 从收入、可赢利性、满意度的角度来讲,哪些是您最好的客户? 哪些客户会对促销作出响应?计划 预测和趋势分析 实施之前预估策略中的潜在变化责任 用于经理、主管的精确及时的报告 公司数以万计的以及其他的公开内容市场营销采购服务销售项目管理财务 / HR计划和模型执行报告和分析开

2、发生产学术界的观点BI实际上是帮助企业提高决策能力和运营能力的概念、方法 、过程 以及软件的集合,其主要目标是将企业所掌握的信息转换成竞争优势,提高企业决策能力、决策效率、决策准确性。什么是 BI与 BI相关的重要概念 BI( Business Intelligence, 商务智能 ) DW( Data Warehouse, 数据仓库 ) ETL(抽取转化 ) OLAP( Online Analysis Process) DM( Data Mining, 数据挖掘)BI( Business Intelligence)商务智能简称 BI, 指通过对数据的收集、管理、分析以及转化,使数据 成为可用

3、的信息,从而获得必要的洞察力和理解力,更好地辅助决策和指导行动。数据仓库 ( Data Warehouse)数据仓库( Data Warehouse 简称 DW) 是一个面向主题的( SubjectOriented)、 集成的( Integrate)、 相对稳定的( Non-Volatile)、 反映历史变化( TimeVariant) 的数据集合。数据仓库是实现商务智能的基础平台数据仓库 VS 数据库 数据仓库系统( 决策系统 ): 面向主题、分析和决策 实时性要求不是特别高 数据检索量大 存储大量的历史数据和当前数据数据库系统( 生产系统 ): 面向应用、事务驱动的 实时性高 数据检索量少

4、 只存当前数据以银行为例储蓄 对公 信用卡 其他数 据 仓 库客户产品渠道交易机构ETLETL是数据抽取( Extracting)、转换( Transforming)、清洗( Cleaning)、装载( Loading)几个过程的简称。ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过 ETL最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去 。ETL数据抽取 :从源数据源系统抽取目的数据源系统需要的数据数据清洗 :重复行数据的清理,无用字段的清理,空值的处理等,正则表达式的使用。数据转换 :数据类型 的转换,比如 int转 varchar,字符型转日期型(如 2009

5、0801转 2009-08-01)等等 。类似 用 1标识男, 2表示 女。ETL分层ODSMIDDW-DMETL流程ETL 工具 开源 kettle 工具 DI Oracle ODI IBM datastage informaticaOLTP & OLAP OLTP( Online Transaction Process)联机事务处理,是公司日常运营的基础,是业务流程信息化的关键,基于生产数据库 。 OLAP( Online Analysis Process)联机分析处理,基于数据仓库的数据分析,以供决策所需,面向管理层,面向未来。OLAP的目标 满足决策支持或多维环境特定的查询和报表需求,

6、它的技术核心是“维”这个概念,因此 OLAP也可以说是多维资料分析工具的集合。 通常所说的 BI分析就是指 OLAP, 更为准确是指 OLAP分析及结果展示。OLTP数据 OLAP数据原始数据 导出数据细节性数据 综合性 和提炼性数据当前值数据 历史 数据可更新 可 更新,但周期性刷新一次处理的数据量小 一 次处理的数据量大面向应用,事务驱动 面向 分析,分析驱动面向操作人员,支持日常操作 面向 决策人 员支持管理需要OLAP分类ROLAPMOLAPHOLAPROLAP的优点 没有大小限制,现有的关系数据库的技术可以沿用,可以通过SQL实现详细数据与概要数据的存储。现有关系型数据库已经对OLA

7、P做了很多优化,包括并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、 SQL 的 OLAP扩展 (cube,rollup)等大大提高 ROALP的速度一般响应 速度 慢不 支持有关预计算的读写 操作无法 完成维之间的计算ROLAP的缺点MOLAP的优点性能 好、响应速度快专为 OLAP所设计,支持高性能的决策支持计算复杂的跨维计算多用户的读写操作行级的计算增加系统复杂度,增加系统培训与维护费用受 操作系统平台中文件大小的限制需要进行预计算,可能导致数据 爆炸无法 支持维的动态 变化缺乏数据 访问的标准MOLAP的缺点HOLAP的优点混合数据组织的 OLAP实现低层是关系型 的高层是多维矩阵 型ROLAP和 MOLAP的有机 结合度量值度量值是决策者所关心的具有实际意义的 数值事实表度量值所在的表称为事实数据表,事实表所表现的特点是包含数值数据 (事实 ),而这些数值数据可以统计汇总以提供有关单位运作历史的信息。此外,每个事实数据表还包括一个或多个列,这些列作为引用相关的维度表的外 码维度维度是人们观察数据的角度。维度表包含描述事实数据表中的事实记录的特性维度分类 常规维度 时间维度 虚拟维度父子维度 基于单张维度表的两个不同列,这两个列一起定义了维度成员的沿袭关系,一列称为成员列表,标识每个成员;另一列称为父键列,标识每个成员的父代

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报