收藏 分享(赏)

Informatica快速入门.doc

上传人:精品资料 文档编号:10190598 上传时间:2019-10-18 格式:DOC 页数:25 大小:4.29MB
下载 相关 举报
Informatica快速入门.doc_第1页
第1页 / 共25页
Informatica快速入门.doc_第2页
第2页 / 共25页
Informatica快速入门.doc_第3页
第3页 / 共25页
Informatica快速入门.doc_第4页
第4页 / 共25页
Informatica快速入门.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

1、Informatica学习快速入门文档 Informatica学习快速入门文档 1 Informatica 概述 .32 安装 Informatica8.6.1 .32.1 服务端安装 32.2 客户端安装 73 配置管理服务器 93.1 创建知识库和集成服务 93.2 客户端到集成服务端的连接 .124 PowerCenter Designer 学习 .134.1 概念和基本定义 .134.2 Mapping 设计和组件的使用 154.2.1 实例一:聚合抽取 .154.2.2 实例二:取 TOP 前三条记录 .164.2.3 实例三:抽取 XML 源 194.3 WorkFlow 的设计和

2、使用 .204.3.1 创建 Session .204.3.2 设计 WorkFlow 224.4 Repository Manager .23Informatica学习快速入门文档 1 Informatica概述Informatica 一直致力于为客户提供具有强大的元数据管理、数据集成和个性化分析递送功能的世界通行标准的统一数据服务平台。Informatica 的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自 Informatica 和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理,提供元数据管理解决方案,帮助企业集成、优化、审核信息资产以提

3、高运营效率,增加客户收益,取得竞争优势。详见文档: 2 安装Informatica8.6.1这里以 Informatica8.6.1 为例:2.1服务端安装找到安装目录 pc861_win32_x86.zipServerWindowsDisk1InstDataVM 下点击安装Informatica学习快速入门文档 选择安装语言,这里以中文版为例点击下一步,并选择安装 PowerCenter8.6.1必须选择事先准备好的安装密匙Informatica学习快速入门文档 选择安装路径HTTPS 配置,配置管理控制台与配置管理器的安全通信(如果没有使用该端口就采用默认)Informatica学习快速入

4、门文档 配置好 Informatica 域并进行下一步,取掉为特定用户启动 Informatica Services,点击完成安装Informatica学习快速入门文档 2.2 客户端安装选择安装设置安装路径Informatica学习快速入门文档 安装完成后可以看到包含的所有工具Informatica学习快速入门文档 3 配置管理服务器3.1 创建知识库和集成服务接下来我们主要是配置知识库管理服务器,PowerCenter 数据整合引擎是基于元数据驱动的,提供了基于元数据驱动的元数据知识库(Repository),知识库是 PowerCenter的核心。在 Informatica Servic

5、es 启动的的情况下,我们可以通过管理控制台来操作。从控制台里我们可以看到很多选项,我们主要是创建存储库服务(Repository)和集成服务,存储库服务(Repository) 存储所有的 ETL 元数据,包括:源、目标表的物理和逻辑元数据, ETL 转换规则,知识库用户权限,ETL 任务运行历史信息等元数据。首先我们创建一个用于测试学习的存储服务器,事先在 Oracle 中建好要用到的数据库此处如果无法创建成功有以下可能:1. 需要设置环境变量,将C:InformaticaPowerCenter8.6.1Serverbin;C:InformaticaPowerCenter8.6.1Repo

6、sitoryServerbin;移到 Path 最前边2. 代码页一定要如下选择Informatica学习快速入门文档 3. 设置知库链接用的数据库用户要有 DBA 角色权限连接字符串设置为当前的 Oracle 服务名Informatica学习快速入门文档 接下来创建集成服务,因为集成服务是依赖于知识库的,注意关联的存储库服务选择刚建好的学习测试存储库,存储库默认要设置用户名和密码为:Administrator至次我们完成了服务端的基本配置,服务端可以对知识库备份和恢复等很多功能,也可以建立其相应的服务,这里不再多述!Informatica学习快速入门文档 3.2 客户端到集成服务端的连接我们

7、开发 ETL 要使用到 PowerCenter Designer 工具,详细的介绍在概述中有,接下我们配置好 Designer 与集成服务的连接:从客户端工具中打开 PowerCenter Repository Manager从菜单上选择存储库配置域 如下:这样就连接上集成测试用例库,选择学习测试用例库,从文件夹选项目创建文件夹,相当于在集成库下的一层子目录至此,打开 PowerCenter Designer 就可开发使用了Informatica学习快速入门文档 4 PowerCenter Designer学习4.1 概念和基本定义最基本的 ETL 包括源的定义,目标定义,和映射,另外我们还可

8、以创建可以重用的Mapplet。使用到的工具如下源分析器:目标设计器:映射设计:传输件设计:Mapplet 组件设计:源分析器是用来定义源的结构,这里的源虽然是从某个数据库导出进来的表结构也可以是某个 XSD 定义的 XML 结构等等,但是仅仅绑定了数据库类型,并不是指定了链接要从那个数据库里抽取数据。这里我们从菜单可以导入表结构,Informatica 提供了 ODBC 的方式链接多种数据源Informatica学习快速入门文档 我们以一个 DW 事实表为例:同样我们可以定义目标结构,常规也是导入表结构,我们也可以在 Mapping 设计中自动创建目标表结构,源定义和目标定义中,我们可以对导

9、进来的表名以及表的结构进行修改以Informatica学习快速入门文档 满足我们的设计需求,但是我们在 WorkFlow 中实现数据抽取中对应的源和目标要和此结构相同,如果要满足变化的源和目标,可以通过 Visio 设计来转换为 Mapping 来实现。4.2 Mapping设计和组件的使用PowerCenter Designer 通过 Mapping 来完成从源到目标的转换,Mapping 设计器中包含了大量的转换组件关于组件详尽的说明,可以打开文档具体学习:转换组件一般包含,转换、端口、属性、以及元数据扩展转换:可以对该转换更改名称和附加具体说明。端口:转换组件大都包含转换输入端口和输出端

10、口以及特定的操作或表达式。属性:该转换组件的特定设置元数据扩展:下边以两个实例来讲解组件的使用4.2.1 实例一:聚合抽取从源到目标,我们中间用聚合 组件,对 OWE_CHARGE 进行 SUM 并按几个维组来聚合,如下图:Informatica学习快速入门文档 从下图我们可以看到该组件端口中字段属包含:I、O 、V、表达式、GroupBy 等属性,对于 OWE_CHARGE 字段我们仅设置输入,创建自定义属性端口 SUM_OWE_CHARGE,其表达式为 SUM(OWE_CHARGE),对于维度键勾选 GroupBy,这样实现了细粒度到粗粒度的聚合每种组件都有自己特定的属性和特定的端口属性,

11、我们通过属性设置或表达式来实现组件的特性,不同组件的搭配来完成整个 Mapping 的设计4.2.2 实例二:取 TOP前三条记录源表数据Informatica学习快速入门文档 目标:取 Score1 TOP 前 3 条记录、和 Score2 TOP 前 3 条记录实现:对源表分别用两个 Rank 组件,Rank 组件有分组排序取前 N 或后 N 条记录的功能,如下图端口属性如下:RankIndex 为自动产生的 Rownum,score1 后的 R 表示以此排序Informatica学习快速入门文档 组件属性设置如下:top/bottom:取前或后Number Of Ranks:取多少位抽取

12、结果:Informatica学习快速入门文档 4.2.3 实例三:抽取XML 源雇员 DTD 定义:设计如下:导入 XML 源结构为源,通过 SQ 分别将雇员信息分解为雇员表,雇员电话,雇员邮件,雇员薪水,具体设计如下图:Informatica学习快速入门文档 4.3 WorkFlow的设计和使用4.3.1 创建 Session在做完 Mapping 设计之后,我们要抽取数据,接下来的任务就是 WorkFlow 的设计,在WorkFlow 设计器中,数据抽取的基本组件是 Session,Session 是映射的一个具体实例,在创建一个 Session 时必须指定一个映射,并由这个 Sessio

13、n 决定了数据抽取的默认源和目标。我们打开 WorkFlow 设计工具,从工具上选择 ,这样我们就可以创建Session,Informatica学习快速入门文档 从库中选择已经设计好的 Mapping,确定双击已经创建好的 Session,设置默认的映射,源,以及目标实例,例如在设计源的时候,我们的源是 Oracle 表结构,在这里相应的设置数据库连接即可,如果源是文件,则要指定路径和文件名,我们将源的 Tracing Level 设置为 Normal, Tracing Level 为数据抽取监控日志的级别Informatica学习快速入门文档 4.3.2 设计WorkFlow在完成 Sess

14、ion 创建后,点击 设计工作流, 工作流是对 Session 在抽取流程上的定制,通过事件、变量、定时器、判断等一系列组件来实现。如下图, 我们创建一个工作流,其中由启动连接到实例一中映射所实例的 Session,这样就实现了工作流接下来我们启动该 WorkFlow从 WorkFlow Monitor 上可以看到动行状况并查看日志,Informatica学习快速入门文档 至此,我们完成典型 WorkFlow 的开发,在 WorkFlow 中,对于可重用的部分,我们可以在 中定义,关于更多的 WorkFlow 组件使用这里就不在细述。4.4 Repository ManagerRepository Manager 工具可以方便我们对知识库的导入和平台转移,例如我们从Windows 平台可以导知识库轻松转移到 Linux 平台,同时 Repository Manager 可以对库进行历史版本的控制。从下图首先可以连接知识库,然后我们可以对映射和工作流等导入和导出,以 XML 中间结构转储如果我们在安装 Informatica 时,选择了启用历史版本功能,则可以像下图,设置知识库的版本Informatica学习快速入门文档 总而言之,Repository 为我们协作开发和统一管理提供了有效的手段。继续加载 整理Informatica学习快速入门文档

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报