1、本科毕业论文(科研 训练 、 毕业设计 )题 目:票据贴现业务报表统计分析姓 名: 学 院 :软件学院系:专 业 : 软 件 工 程年 级: 学 号: 指 导 教 师 ( 校 内 ) : 职 称 : 指 导 教 师 ( 校 外 ) : 职 称 : 年 月 日票据贴现业务报表统计分析 第 1 页 票据贴现业务报表统计分析Statistics and Analysis by Reports on Bill Discount Business 摘要 票据贴现是指商业汇票的持票人将未到期的商业汇票转让于银行,银行按票面金额扣除贴现利息后将余额付给持票人的一种融通资金行为。现如今社会,商业汇票贴现业务规
2、范化、简捷化、低成本化的特征使其日益成为企业短期融资的首选;随着 WTO 的加入,票据市场势必走向系统化、专业化,银行建立有效的票据业务管理平台势在必行。本设计借助报表管理工具Cognos 系列软件,利用先进的统计分析方法 多维数据分析,对中国建设银行 2005 年上半年票据贴现的业务信息进行科学的统计分析,并在此基础上完成报表的制作与网络发布,以达到最终为贴现业务的宏观管理与风险监控、客户关系管理及市场营销提供准确的决策依据的目的。本论文对如何对贴现业务的实际需求内容,进行适时的、灵活的、多维度的数据汇总统计查询和分析,生成各类统计报表,作了详细说明。对数据进行多维分析,并在此基础上制作出各
3、种形式的报表,把这一技术运用到银行票据业务当中,这是本设计的创新之处;此外,不需要具备很深的数据库专业知识一样可以对业务进行各种分析,这是本设计在银行业务中的一项重要贡献;同时,在银行部门间的沟通方面一改传统的手工分发模式,实行网上发布与管理报表,这也是本设计影响银行在其业务管理方面作出的一项重大改革。 关键词 票据贴现 多维度 查询和分析 报表票据贴现业务报表统计分析 第 2 页 目录第一章 绪论 .51.1 1 项目的背景和意 义 .51.2 2 国内研究 现状 .51.3 3 本项目的研究工作和创新之处 .51.4 4 本文的 组织结构 5第二章 基础知识 .72.1 1 汇票、商 业汇
4、票及汇票贴现的基本定义 .72.2 2 票据贴现业务 系统的必要性 .72.3 3 什么是 业务智能( BI) 72.4 4 数据仓库 82.5 5 OLAP 应用技术 82.6 6 本章小 结 8第三章 总体设计流程 .93.1 1 维度建模宣言 .93.2 2 辅助软 件 .113.2 2 开发流程概述 .123.3 3 本章小 结 .12第四章 详细设计说 明 134.1 1 形成数据源 134.2 2 构建模型 .154.3 3 生成立方体 174.4 4 数据展示和制作 报 表 .184.5 5 本章小 结 .21第五章 具体 设计方案 225.1 1 分析概述 .225.1.1 .
5、 1 分析主题 225.1.2 . 2 分析手段 225.1.3 . 3 分析表现方法 225.1.4 . 4 维度、层及类别的定义 .225.1.5 . 5 指标(度量)描述 .245.2 2 客户分析 .245.2.1 . 1 目标需求 245.2.1.1 1 . 1 业务量统计 245.2.1.2 1 . 2 客户量统计 245 . 2 . 2 维度 255 . 2 . 3 指标 25票据贴现业务报表统计分析 第 3 页 5.3 3 运营分析 .255.3.1 . 1 目标需求 255.3.1.1 1 . 1 业务量统计 255 . 3 . 2 维度 255 . 3 . 3 指标 255
6、.4 4 利率分析 .265.4.1 . 1 目标需求 265.4.1.1 1 . 1 贴现利率趋势分析 .265 . 4 . 2 维度 265 . 4 . 3 指标 265.5 5 财务分析 .265.5.1 . 1 目标需求 275.5.1.1 1 . 1 利息收入与支出的统计 275 . 5 . 2 维度 275 . 5 . 3 指标 275.6 6 逾期贴现 票据分析 .275.6.1 . 1 目标需求 275.6.1.1 1 . 1 逾期贴现票据业务量统计 .285 . 6 . 2 维度 285 . 6 . 3 指标 285.7 7 本章小 结 .28结束语 29致谢语 30 参考文
7、献 32票据贴现业务报表统计分析 第 4 页 第一章 绪论1.1 1 项目的背景和意义自银行信息系统诞生以来,报表管理一直被认为是银行业务系统和管理信息系统的一个组成部分。报表作为一种经过归纳、整理和统计的内容信息,是银行服务、管理和内部控制的重要依据,是银行极具价值的宝贵财富。银行报表是银行管理信息和控制信息的重要组成部分,因此需要一个先进的解决方案来对其进行有效的管理及再利用。为了应对银行间激烈的竞争以及票据市场的发展趋势,中国建设银行决定和北大青鸟科技股份有限公司在原有农业银行商业汇票交易管理系统的基础上共同建设一套票据贴现业务综合处理系统及接口平台, 以便为全行票据业务的开展提供有效的
8、操作平台、管理工具、和沟通渠道。本设计致力于在本系统所形成有关票据的明细信息和账务数据的基础上,根据银行对贴现业务的实际需求内容,进行适时的、灵活的、多维度的数据汇总统计查询和分析,生成各类 统 计 报 表 , 并 能 通 过 曲 线 图 、 饼 图 、 柱 状 图 等 形 式 , 从 而 分 析 过 去 、 反 映 现 实 业 务 的 状 况 , 为 贴 现 业 务 的 宏 观 管 理 与 风 险 监 控 、 客 户 关 系 管 理 及 市 场 营 销 提 供 准 确 的 决 策 依 据 。1.2 2 国内研究 现状目前的报表处理模式在信息系统大集中后将面临重大的问题。首先,信息量和信息复杂
9、度的急剧增大,使对报表制作、分析人员的专业技术要求提高;其次,传统对数据的二维的统计分析方法面对现如今大规模的数据仓库,显得无能为力;最后,由于系统覆盖面积的增大,报表的人工拆分和发送难以操作,银行间票据业务的沟通出现问题。因此,过去的报表服务体系已经不能适应大集中、大规模的业务、性能方面的要求。1.3 3 本项 目的研究工作和 创新之处本 设 计 利 用 先 进 的 统 计 分 析 方 法 多 维 数 据 分 析 , 借 助 报 表 管 理 工 具 Cognos 系列软 件 , 基 于 现 实 数 据 , 对 中 国 建 设 银 行 2005 年上半年票据 贴现的大量业务信息进行科学的统计分
10、析,并在此基础上参与报表的制作与网络发布。本设计的目标就是要实现前、后台业务的统一联动,实现商业汇票“生命周期”在银行的电子化交易管理,加强风险防范,实现全 行票据业务分散经营管理模式向统一经营管理模式的转变。 对数据进行多维分析,并在此基础上制作出各种形式的报表,把这一技术运用到银行票据业务当中,这是本设计的创新之处;此外,不需要具备很深的数据库专业知识一样可以对业务进行各种分析,这是本设计在银行业务中的一项重要贡献;同时,在银行部门间的沟通方面一改传统的手工分发模式,实行网上发布与管理报表,这也是本设计影响银行在其业务管理方面作出的一项重大改革。本设计弥补了传统报表服务中的不足,使银行票据
11、管理走向专业化、体系化。1.4 4 本文的 组织结构本文共分五章。票据贴现业务报表统计分析 第 5 页 第一章主要描述项目的背景意义以及国内的一些研究现状,并介绍了本文所做的主要工作及主要创新之处。第二章中介绍了本设计必要的专业基础知识。第三章对本设计总体设计流程作了交待。第四章阐述了详细的设计过程。第五章针对现实的票据业务数据对本设计的具体实现方案作了详尽的说明。最后是结束语,总结本文的工作,并对票据贴现报表管理领域在今后的发展作出了设想。票据贴现业务报表统计分析 第 6 页 第二章 基础知识总体说来,本设计的研究领域是对银行信息的管理。在本章中,您将了解到本设计所涉及的基本概念。2.1 1
12、 汇票、商业汇票及汇票贴现的基本定义就票据法所规范的狭义票据来说, 票据可分为汇票、本票和支票。汇票是出票人签发的,委托付款人在见票时或者在指定日期无条件支付确定的金额给收款人或者持票人的票据。汇票分为银行汇票和商业汇票。银行汇票是汇款人将款项交存当地银行,由银行签发给汇款人持往异地办理转账结算或支取现金的票据。银行汇票结算方式是指利用银行汇票办理转账结算的方式。商业汇票是出票人签发的,委托付款人在付款日期无条件支付确定金额给收款人或持票人的一种票据。商业汇票按其承兑人的不同分为商业承兑汇票和银行承兑汇票。商业承兑汇票由银行以外的付款人承兑,是由出票人签发经付款人承兑,或由付款人签发并承兑,或
13、由收款人签发经付款人承兑的票据。银行承兑汇票是指银行承诺在商业汇票到期日支付汇票金额的一种票据行为。票 据 贴 现 是 收 款 人 或 持 票 人 在 资 金 不 足 时 , 将 未 到 期 的 商 业 汇 票 转 让 于 银 行 , 向 银 行 申 请贴 现 , 银行收进这些未到期的商 业汇票,按票面金额扣除贴现利息后将余额支付给收款人的一种融通资金行为,是银行的一项与商业信用结合的放款业务。银行在贴现票据时,贴现付款额的计算公式如下:银行贴现付款额票据面额 (一年贴现率 贴现后到期天数十 365 天 ) (1 )2.2 2 票据贴现业务系统的必要性票据贴现可以使一部分闲散资金拥有者互相利用
14、,共获利益。故贴现在货币市场活动中处于中心地位。票据贴现市场与其他市场相比较,有许多特殊的优点。对银行来说,贴现银行可获得如下利益:利息收益较多;资金收回较快;资金收回较安全等。对于贴现企业,通过贴现可取得短期融通资金。我国市场经济的深入发展为票据贴现业务提供了良好的发展空间,客户需求的多样化也需要积极发展票据贴现业务。然而,如今银行的票据贴现业务基本上还停留在原始手工的经营管理模式,为了给各级管理人员和业务人员提供灵活、及时、全面的统计分析信息,部分取代目前贴现业务中的纸质审批流程和大量分散的手工信息整理分析,提高业务处理效率和规范化管理水平,促进全行票据贴现业务向“专业化、规模化、集约化”
15、经营管理模式的转 变,银行必须开发自己的票据业务系统。2.3 3 什么是业务智能( BI)近年来业务智能(Bus i ness Inte lli gence )的 话 题 开 始 在 国 内 热 起 来 。 业 务 智 能 (BI )是以 数 据 仓 库 为 基 础 , 结 合 决 策 支 持 系 统 对 数 据 进 行 收 集 、 转 换 、 分 析 和 分 发 的 过 程 , 以 此 来 帮助 企 业 加 强 对 业 务 信 息 的 智 能 化 管 理 , 获 得 更 好 的 决 策 。 这 是 在 计 算 机 应 用 水 平 达 到 一 定 程 度 、数 据 积 累 到 一 定 量 之
16、后 提 上 议 事 日 程 的 一 个 应 用 领 域 。它的作用包括:票据贴现业务报表统计分析 第 7 页 1将企业数据用于决策支持2能够探察和分析数据以揭示企业内部的某种趋势总之,业务智能是把数据转化成知识的过程。包括信息的获取、分析和交流,帮助人们把获得的有用的知识应用于业务。本设计实际上就是一个业务智能应用的范例。2.4 4 数据 仓库既然本设计针对的是银行业务中的报表分析,自然离不开大量的数据,也就引出了对数据的处理技术的研究。数据仓库不同于普通易变的数据库,它是一个面向主题的、集成的、相对稳定的、反映历 史 变 化的、包含商 业 信息的数据集合,用于支持管理决策。英文叫 Data
17、Warehouse, 简 称DW。OLAP系统就是来解决其中一部分目 标的。2.5 5 OLAP 应用技术我 们 都知道 OLTP,即 联 机事 务处 理,就是我 们 平常用的数据 库 。 OLTP 通常有大量并 发 添加和修改,随时变化,包含大量的数据,具有复杂的结构。当我 们 把 OLTP 装 载 到 DW 中,一般就不再有修改,随着数据的增加而定期更新,而不是随频繁发生的事务而更新。结构和安全性也更简化,目的是提高分析查询的效率,而不是进行事务处理。这就叫 OLAP(联机分析处理) 。OLAP 技 术 使 数 据 仓 库 能 够 快 速 响 应 重 复 而 复 杂 的 分 析 查 询 ,
18、 从 而 使 数 据 仓 库 能 有 效 地 用 于联 机 分 析 。 OLAP 的 多 维 数 据 模 型 和 数 据 聚 合 技 术 可 以 组 织 并 汇 总 大 量 的 数 据 , 以 便 能 够 利 用 联机 分 析 和 图 形 工 具 迅 速 对 数 据 进 行 评 估 。 当 分 析 人 员 搜 寻 答 案 或 试 探 可 能 性 时 , 在 得 到 对 历史 数 据 查 询 的 回 答 后 , 经 常 需 要 进 行 进 一 步 查 询 。 OLAP 系 统 可以快速灵活地 为 分析人 员 提供实时支持。通 常 的 OLAP 应 用 有 财 务 报 表 、 市 场 分 析 、
19、市 场 计 划 、 客 户 服 务 等 。 目 前 国 内 已 经 有 大 量 丰富 的 应 用 , 比 如 银 行 、 证 券 、 电 信 、 生 产 、 销 售 行 业 , 都 有 很 多 的 成 功 案 例 。显然,本设计使用的是 OLAP 技术。在 OLAP 中,数据不再以关系型数据 结构存放,而是以多 维的数据结构存放。不再具有Deta il 的 数 据 , 而 是 只 有 Ro ll up 后 的 信 息 。 也 就 是 说 , OLAP 的 核 心 技 术 是 “维 ” 这个概念。2.6 6 本章小 结本设计的实质是数据仓库的管理在银行票据业务领域的应用,我们把它归结为业务智能的
20、一个应用实例。本设计所使用的 OLAP 技术就是特别针对数据仓库的解决方案。有了本章对基本概念的介绍,便可以明确本设计的理论基础。票据贴现业务报表统计分析 第 8 页 第三章 总体设计流程本章对如何实现设计目标作了总体的说明。在本章中,首先详细论述了本设计的关键技术,即维度建模,按“维” 组织 数据;然后简单介绍了本设计所用的辅助软件;最后概括了 本设计的总体流程。3.1 1 维度建模宣言顾名思义,建模,即为数据建立模型,以应用于数据仓库的管理及最终用户的交付。本设计的实现关键就是建模,在模型的基础上才能进行各种业务分析。谈 到 建 模 , 恐 怕 您 会 马 上 想 到 最 熟 悉 的 实
21、体 -关 系 ( E-R) 建 模 。 实 体 -关系建模是用来 阐 明数据源之间所存在的细微关系的一种规范,它力求删除数据库中的所有冗余。然而事实上是 怎 样 的 呢 ? 考 虑 一 下 , 如 果 用 ER 图来表示银行的票据贴现业务流程,ER 模型可能会在一张图上画出银行名称、银行级别、客户名称、信用等级、科目种类以及时间、地区等许多实体 。 我 记 得 我 在 UML 这门课 最后做一个配送公司的 业务 系 统项 目 时 遇到的最大 问题 就是 实 体太多了,关系太复杂了,几十个实体方框,近百条折线像蜘蛛网一样布满了 Ra t i ona l Rose 的整个工作区,以至于最后为如何将
22、整个设计模型清晰地打印在一张 A4 纸上而头疼,可见ER 图 无 疑 是 过 于 复 杂 了 。 不 仅 如 此 , 对 于 大 型 数 据 仓 库 来 说 , 如 果 要 表 示 在 某 个 特 定 时 刻 的 不能 在 一 个 数 据 集 合 中 共 存 的 多 个 业 务 流 程 , 如 我 想 查 询 一 个 二 级 银 行 1995 年度在北京地区对食品行业单位的转贴现情况,要怎么表现出来呢?显然 ER 图显得无能为力了。在 实 现 本 设 计 时 , 我 决 定 尝 试 使 用 不 同 于 传 统 建 模 方 案 的 维 度 建 模 , 当 然 这 也 是 OLAP 技 术的客观要
23、求。维度建模是一种逻辑设计技术,试图将数据以标准化的、直觉化的框架表现出来,以支持高性能数据查询。维度是一个与业务相关的观察角度,依赖于数据的有效性和表达 业 务 成 效 的 关 键 性 能 指 标 , 能 够 回 答 Who、W hat、W here 和 When 的问题。一 个 维 度 (D i mens i ons) 下 设 有 若 干 层 ( Leve l s ) , 每 层 中 数 据 的 具 体 取 值 叫 做 类 别( Categor i es) 。 以 这 样 一 种 结 构 组 织 起 来 的 数 据 就 叫 做 多 维 数 据 , 通 过 从 多 个 角 度 探 察 数 据
24、 , 能确 切 地 发 现 其 内 部 的 某 种 趋 势 和 某 种 信 息 。数 据 被 组 织 进 各 个 维 度 , 并 放 在 相 应 级 别 的 层 里 。 类 别 是 各 维 度 每 层 中 数 据 的 具 体 取 值 。下 层 中 的 类 别 与 上 层 中 的 某 个 类 别 有 父 子 关 系 。 例 如 : 在 设 计 中 我 们 定 义 一 个 “日 期 维 度 ” 。日期维度下第一层是年,第二层是季度,第三层是月,第四层是日, 2004、2005 等是年的 类 别 , Q1、 Q2、 Q3、 Q4 是季度的 类别 , 1 月 、 2 月等是月的 类别 , 1 日 、
25、2 日等是日的 类别 。(如图 3 . 1)票据贴现业务报表统计分析 第 9 页 Q1 Q2维度月(第三层)图 3.1在 本 设 计 中 , 我 们 把 大 数 据 量 的 细 节 数 据 放 在 Inform i x 关 系 数 据 库 里 , 而 在 一 个 单 独 的多 维 数 据 库 中 维 护 汇 总 数 据 。 这 种 实 现 OLAP 的方式性能优良,可伸缩性较好。每个维度模型有一个具有多个外键的事实表以及一组叫做维度表的小表组成。每个维度表有一个对应事实表中多个外键的单一主键,这种“ 星型“ 结构通常被称为星型连接。这就是本系统数据库的结构。(如图 3 . 2)日期维度 类别年
26、(第一层)1998Q2 Q3季度(第二层)1 月Q4Q1Q4Q319973 月2 月3 月2 月1 月票据贴现业务报表统计分析 第 10 页 时间键(主键) 年季月周日区域维度票据业务事实表科目种类维度区域键(外键) 时间键(外键) 科目键(外键)贴现余额贴现累计发生额业务笔数时间维度图 3.2一个事实表由两个或多个外键组成,它总是表达一种多对多的数据关系,事实表最为有用之处在于它有一个或多个数值型的度量值。度量是用于评价业务状况的数值型数据。企业活动中通常是通过如销售额、费用、业务指标、库存量和定额一类的关键性能指标度量来监测业务的成效。在图中,度量包括贴现余额、贴现累计发生额和业务笔数。相
27、比之下,维度表通常包含一些描述性的文本信息。维度属性用于作为大多数数据仓库查询中有趣的约束的来源。通过区域维度表中的西北属性将查询限定为发生在西北地区的业务,通过科目种类维度表中的直贴类型属性将查询限定为直贴的业务。本项目的具体维度设计定义会在“5 . 1 . 4 维度、层 及类别的定义”中详细列出。3.2 2 辅助 软件为 找 到 一 个 适 合 于 实 现 本 设 计 的 辅 助 工 具 , 我 尝 试 了 许 多 OLAP 工 具 , 最 终 选 择 了 Cognos公司的业务智能系列软件。在整个系统报表分析中,主要针对数据仓库建立和数据分析提供工具以解决数据分析展示 的 需 求 , 用
28、 到 的 有 Impromptu 和 PowerP l ay, 其 中 PowerP l ay 包 括 PowerP l ay Transformer 和 PowerP l ay. 两 个 组 件 。 也 许 您 还 是 第 一 次 听 说 它 , 没 关 系 , 在 下 一 章 的 详 细设 计 说 明 中 结区域键(主键) 东北西北西南科目种类键(主键) 直贴再贴现转贴现买入转贴现卖出利息支出票据贴现业务报表统计分析 第 11 页 合开发过程的介绍,您会慢慢了解这套软件的。3.2 2 开发 流程概述从数据库中的原始数据到形成一张多维的业务报表,大致分为四个步骤(如 图 3 . 3) :1
29、从 Inform i x 数 据 库 中 提 取 需 要 的 信 息 , 形 成 数 据 源 。 这 一 过 程 使 用 Impromptu 工具实现。2 根据业务要求构建模型。这一过程使用 Transformer 制作。3 生 成 多 维 数 据 结 构 , 即 数 据 立 方 体 。 这 也 是 凭 借 Transformer 来完成。4 根 据 特 定 的 数 据 立 方 体 制 作 出 各 种 样 式 的 报 表 , 并 在 此 基 础 上 进 行 多 维 的 业 务 分 析 。这 是 在 PowerP l ay 中 进 行 。 生 成 的 报 表 还 可 以 发 布 到 网 络 上
30、, 实 现 共 享 , 建 立 银 行间 便 捷 的 沟 通 渠 道 。图 3.33.3 3 本章小 结本章提出并着重论述了本设计的核心思想,即对数据进行多维分析的理论;并说明了本设计所用数据库的组织结构。本章通过高度概括本设计的工作流程,对后续详细地说明设计过程作了准备。票据贴现业务报表统计分析 第 12 页 第四章 详细设计说明本 设 计 根 据 银 行 对 贴 现 业 务 的 实 际 需 求 内 容 , 进 行 适 时 的 、 灵 活 的 、 多 维 度 的 数 据 汇 总统 计 查 询 和 分 析 , 生 成 各 类 统 计 报 表 , 并 能 通 过 曲 线 图 、 饼 图 、 柱
31、状 图 等 形 式 表 现 出 来 。 本章 就 是 对 此 工 作 的 详 细 过 程 进 行 阐 述 。4.1 1 形成数据源这 一 步 骤 用 到 Impromptu, 它 是 C li ent/ Server 模式的企 业级 交互式数据 库查询 和 报 表生成 工 具 。 Impromptu 采用的是在数据 仓库 数据 组织 上,按各 类 用 户 考察 业务 的方式,来展示信息 。 在 Impromptu 信 息 目 录 中 可 加 入 业 务 知 识 与 数 据 的 访 问 规 则 。 它 用 业 务 术 语 组 织 数 据 , 使用户从数据库的复杂结构(如 SQL 语法、表连接和加
32、密域名)中隔离出来。以这种方式展示数据,使用户易于在数据库中浏览数据并创建各种报表。 在本 设计应 用中, Impromptu 主要用来 协 助 Powerp l ay Transformer 定 义 数据源, 预处 理数据源,使模型数据源定义工作效率提高。 数 据 源 文 件 是 把 数 据 带 入 模 型 的 计 算 机 文 件 , 来 自 企 业 数 据 , 是 后 面 制 作 模 型 所 需 的 全部 或 部 分 源 数 据 。形成数据源这一过程分两步,一是连接到关系型数据库上,二是形成数据源定义文件. i qd。 第 一 步 , 连 接 到 关 系 型 数 据 库 , 就 是 要 创
33、 建 一 个 信 息 目 录 ( ca ta l og) 文 件 ( . cat ) 。 ca ta l og是一个文件,包含了一些与数据检索有关的信息。如数据库的位置、报表与数据库表项的引用关系、每个用户类可以看到哪部分数据等(如 图 4 . 1) 。图 4 . 1创 建 cata l og 的 作 用 一 是 与 数 据 库 相 连 , 二 是 可 通 过 打 开 对 应 的 cata l og 制作各种报表, 当 然 , 在 Impromptu 中建立的 报 表并不是多 维 的,所以我 们 一般不用 这 个建立 报 表,而把分析 制 作 各 种 报 表 的 任 务 交 给 后 面 的 P
34、owerP l ay 来完成,但为了和数据库相连,创建 cata l og 这一步是必要的。总之,cata l og 就是把数据库中的数据按照用户的业务观点来组织。用户在数据库中挑票据贴现业务报表统计分析 第 13 页 DatabaseDatabase报表图 4.2Catalog选出所需要的表与字段,以后就使用信息目录去查询数据,而不会直接接触数据库,所以不会破坏数据库中的数据;而且把用户和数据隔离开来,用户不必去理会复杂的无关的专业化的 数 据 库 信 息 ; cata l og 并不含数据本身,它保存的是数据的引用关系,计算公式,格式参数,用户权限等。使用 cata l og 对管理员也有
35、好处,可以使其服务于多种不同的用户群而不必修改数据库;能够帮助描述什么数据对用户是有用的,这些数据如何访问。当然,这样一来 如 果 数 据 库 中 的 数 据 有 所 变 动 , ca ta l og 是 不 会 随 着 变 化 的 。 由 于 在 本 设 计 中 所 使 用 的cata l og 都是事先创建好了的,所以在此只作简单介绍。第 二 步 , 形 成 数 据 源 定 义 文 件 . i qd。 在 这 个 过 程 中 , 打 开 在 一 个 cata l og, 然后就可以新建一张简单报表,一个 cata l og 可 对 应 多 个 报 表 , 但 每 个 报 表 只 能 与 一
36、 个 cata l og 相关联。(如 图 4 . 2)我 们 对 cata l og 文件中的数据进行进一步的一些预处理,如添加过滤条件、增加计算字段等等,因为我们不打算利用这个报表上进行统计分析,所以新建时只选 S i mp l e L i st 就可以 , 自 动 生 成 报 表 后 也 不 用 对 它 进 行 编 辑 。 然 后 把 它 存 为 一 个 名 为 . i qd 的 文 件 , 这 就 是数 据 源 文 件 。 (如 图 4 . 3)图 4 . 3使 用 . i qd 是 维 护 和 更 新 数 据 源 数 据 的 有 效 方 法 。 不 仅 是 由 于 . i qd 文件
37、只包含从数据库抽取 的 结 构 信 息 , 占 用 的 空 间 小 , 避 免 了 向 生 产 平 台 传 输 大 规 模 的 文 件 , 更 因 为 Impromptu 提供对多种不同数据库的访问特性,使数据源的创建和维护简单化。票据贴现业务报表统计分析 第 14 页 由 于 . i qd 文件是个文本文件,以后修改时不能用 Impromptu 直 接 打 开 。 不 过 , 在 save 它 时 会 自 动 另 外 保 存 为 一 个 . i mr 文 件 , 这 是 一 个 快 照 , 是 报 表 中 数 据 的 一 个 永 久 性 的静 态 副 本 , 象 一 张 照 片 , 反 映
38、的 是 快 照 刚 建 立 时 的 状 态 。 保 存 快 照 时 , 快 照 和 报 表 是 保 存 在同 一 个 文 件 中 ( . i mr) 。 所 以 以 后 要 修 改 数 据 源 时 用 Impromptu 打 开 对 应 的 . i mr 文件就可以了。形成数据源 这 一步 骤 是后 续 所有步 骤 的数据来源,数据源可以是 Orac l e、 DB、 I nform i x、Sybase、 Sq l Server 等 大 型 关 系 型 数 据 库 , 也 可 以 是 Access、 dBase 等桌面型数据 库 或平面文 件 ; 可 以 是 未 经 ETL 处 理 的 业
39、务 数 据 库 , 也 可 以 是 经 过 ETL 处理后的数据集市,可以根据项 目 需 要 , 综 合 效 率 、 存 储 空 间 、 硬 件 条 件 等 条 件 进 行 灵 活 配 置 。 这 里 , 我 们 用 的 是 Inform i x 数据库。4.2 2 构建模型这 个 过 程 是 指 利 用 Transformer,导入所需的数据源( . i qd 文件) , Trans former 能够直接 读 解 包 含 在 . i qd 中的数据的列属性,也可以更新数据源的列,以按照需求设计数据模型, 规划好度量值和维度,它将业务的每个方面构造成一个维度,所有的维度在一起提供了业务的多维
40、视图。在 界 面 中 , 可 以 看 到 一 个 Data Sources 窗口,这显示的是我们所导入的数据源( . i qd) 文 件 。 (如 图 4 . 4)图 4 . 4下图这个叫 Measures 窗口,它显示出在此模型设计中哪些列是度量(如 图 4 . 5) 。图 4 . 5还 有 一 个 D i mens i on Map 窗 口 , 我 们 可 以 从 Data Sources 窗 口 把 某 列 拖 到 D i mens i on Map 窗口的最上面,从而形成维度,维度与维度并排放置。再把另外某列拖到维度的下面,这列就 成 为 了 它 上 面 那 个 维 度 的 第 一 层
41、 , 以 此 类 推 。 (如 图 4 . 6)票据贴现业务报表统计分析 第 15 页 东西部层东部西部图 4 . 6这 个 多 维 视 图 的 数 据 以 后 将 被 存 为 一 个 立 方 体 。 即 这 一 步 是 为 生 成 数 据 立 方 体 做 准 备 。 经过 这 个 过 程 , 保 存 为 . py i 文件。. py i 文 件 就 是 模 型 定 义 文 件 , 以 后 要 修 改 模 型 时 我 们 就 打 开它 。 通 过 大量的 实 践,我深刻体会到模型 设计 可以 说 本 质 上 20%是科技, 80%是 艺术 。模型 设计的好坏,主要取决于业务数据的规范和对业务数
42、据及其关系的理解。我也总结了一些模型设计的原则,在此愿和大家分享:1不要试图 用一个模式解决所有的 业务问题,应为每个问题设计一个模型。2 选择 最符合 业务结 构的 维 度及构成 维 度的 层 次。确定模型要包括如下信息: 谁 ?内 容?地点?原因?时间?方法?3 从 数 据 源 抽 取 维 度 与 层 时 , 每 一 个 维 度 的 最 底 层 必 须 对 应 数 据 源 中 的 一 个 列 ; 高 层 也 最 好 对 应 一 个 列 ; 每 个 标 准 度 量 对 应 一 个 列 。 因 为 Transformer 会自 动 保持源数据列 与层 的 相 关 性 , 并 检 查 用 更 新
43、 数 据 建 立 类 别 时 需 要 做 的 改 变 。 也 可 用 Transformer 手 动创建手工层。但源数据更新后,可能需要手动改变手工层。4 在 维 度 和 层 的 创 建 上 , 为 了 从 模 型 中 得 出 最 具 分 析 性 的 结 果 , 最 少 要 创 建 3 个维度;至少有一个多层次维度(多个更好) ; 但 不 要 超 过 7 个 维 度 和 5 个层次。这样导航最迅 速 , 使 用 最 方 便 。 不 过 Transformer 对此并无限制,通常类别越多层次越多。5在每层类别 比例方面, 维度中上下层类别数比例保持在 1 : 10(或更少) 。否则,在浏览 Po
44、werP l ay 的 图 表 时 , 可 能 会 感 觉 不 太 方 便 。 若 难 保 持 该 比 例 , 可 考 虑 引 入 手 工 层 。 如在 区 域 维 度 , 国 家 层 (上层) 和 办 事 处 层 (下层) 之 间 显 得 不 太 平 衡 , 可 加 入 一 个 名为 “东 西 部 ”的 手 工 层 , 把 各 个 城 市 分 为 东 部 和 西 部 两 类 。 (如 图 4 . 7)国家层中国图 4 . 7办事处层北京福州兰州北海6 在 判 断 哪 列 是 度 量 时 , 看 它 是 否 是 数 字 或 数 量 , 如 “收 入 ”、 “利 润 ”或一个 简单 的出票据贴现
45、业务报表统计分析 第 16 页 现次数。7 在 所 有 信 息 中 , 也 许 只 需 某 些 重 要 部 分 的 数 据 就 能 够 帮 助 决 策 业 务 , 因 此 应 利 用 少 量 的信 息 , 支 持 大 部 分 的 决 策 。 提 供 额 外 的 信 息 会 使 成 本 显 著 上 升 , 而 信 息 价 值 却 明 显 下降 。 设 计 模 型 时 , 应 以 最 小 成 本 交 付 最 大 利 益 。4.3 3 生成立方体这 个 过 程 也 由 Transformer 完 成 。 Trans former 可以将平面文件或是二 维 关系型数据生成一个或多个称为 PowerCu
46、be 的多维数据立方体 ( . mdc 文件, ) 。PowerCube 是 采 用 多 维 分 析 的 在 线 分 析 技 术 ( OLAP) , 将 数 据 构 造 成 的 多 维 数 据 结 构 , 是供 PowerP l ay 应 用 的 一 个 多 维 数 据 包 。 它 是 按 探 察 业 务 的 OLAP 多 维 因素分析模型的 设计创 建, 通 过 对 多 维 数 据 立 方 体 的 OLAP 分 析 , 用 户 可 以 辨 明 趋 势 、 跟 踪 业 务 运 作 、 创 建 高 效 的 统 计 汇 总报 表 。 PowerCube 是 由 元 数 据 ( Me tadata)
47、 和 值 数 据 (Va l ues-data)组 成 。 元 数 据 是 PowerCube中关于值数据的数据;值数据是可视数据,如维度、层、类别。 PowerCube 在 对 数 据 进 行 索 引 化 的 同 时 , 能 够 通 过 特 殊 技 术 有 效 地 压 缩 数 据 尺 寸 , 使 得在 PowerP l ay 应 用 中 , 能对用户的分析要求作出快速的响应。PowerCube 的 创 建和修改都在 Transformer 中 , 每 个 PowerCube 由于其 维 度 结 构的不同 而 不 同 。 在 下 一 步 使 用 PowerP l ay 进 行数据展示和制作 报
48、 表的 过 程中要打开一 张报 表必 须事 先指定用哪个 PowerCube 打 开 。 (如 图 4 . 8)图 4 . 8待进度条完成后,生成的立方体会显示在 PowerCubes 窗口中(如 图 4 . 9) 。票据贴现业务报表统计分析 第 17 页 4.4 4 数据展示和制作报表Power Cubes 窗口图 4 . 9PowerP l ay 是 业 界 领 先 的 业 务 智 能 ( BI) 工具, 应 用于企 业 数据的多 维 分折 (OLAP)。 它 不仅 能 够 让 系 统 中 的 每 一 位 用 户 都 能 够 轻 松 自 如 地 访 问 重 要 数 据 , 从 而 更 有
49、效 地 管 理 其 业 务 , 作 出 正 确 决 策 ; 还 能 对 关 键 数 据 进 行 多 维 分 析 和 统 计 汇 总 报 表 制 作 , 从 而 展 现 整 个 行 业 或 大 环境 的 发 展 的 趋 势 、 跟 踪 主 要 性 能 指 标 (KPI )、控制流程运作、有力支持高层决策。这 一 过 程 是 指 用 PowerP l ay 打 开 立 方 体 文 件 , 对 立 方 体 进 行 切 片 和 旋 转 (S li ce & D i ce)、钻取( Dr ill Down and Dr ill Up) 以及改变显示方式等观察,获取所需的数据。而制作固定报 表 的 工 作 也 在 这 一 步 完 成 , 用 户 可 以 根 据 需 求 用 PowerP l ay 制 作 指 定 格 式 的 报 表 , 并 将 其保 存 为 报 表 文 件 ( . ppx) 。PowerP l ay 的界面主要由维度栏、维度视图、交叉表和各种工具按钮组成。维度栏显示各维度当前的定位,始终反映着数据探察当前所处的位置。在维度栏中,每个维度对应有尽有一个标签,全部度量有一个标签。(如图