1、第18章 SQL Server分析服务,在Microsoft SQL Server 2005 Analysis Services(SSAS)中,可以方便地创建复杂的联机分析处理(OLAP)和数据挖掘解决方案。Analysis Services工具提供了设计、创建和管理来自数据仓库的多维数据集和数据挖掘模型的功能,还提供对OLAP数据和挖掘数据的客户端访问。,18.1 分析服务概述,1Analysis Services概念(SSAS)Analysis Services通过允许开发人员在一个或多个物理数据源中定义一个称为统一维度模型(UDM)的数据模型,从而很好地组合了传统的基于OLAP分析和基于
2、关系报表的各个最佳方面。,基于OLAP、报表以及自定义商业智能应用程序的所有最终用户查询都将通过UDM(可提供一个此关系数据的业务视图)访问基础数据源中的数据。,2Analysis Services体系结构,Microsoft SQL Server 2005 Analysis Services(SSAS)使用服务器组件和客户端组件为商业智能应用程序提供联机分析处理(OLAP)和数据挖掘功能。,3统一维度模型(UDM),统一维度模型(UDM)的作用是在用户和数据源之间搭建一座桥梁,如图18-2所示。UDM通过一个或多个物理数据源构造而成,最终用户可以使用多种客户端工具之一(如图18-2 统一维度
3、模型 Microsoft Excel)来对UDM发出查询。,图18-2 统一维度模型,18.2 分析服务解决方案,18.2.1 解决方案的组成Microsoft SQL Server Management Studio提供了两个用于管理数据库项目(如脚本、查询、数据连接和文件)的容器:解决方案和项目。这些容器所包含的对象称为项。,“项目”是一组文件和相关的元数据(如连接信息),项目中的文件取决于该项目用于哪个Microsoft SQL Server组件。“解决方案”包含一个或多个项目,以及定义整个解决方案所需的文件和元数据。,18.2.2 创建解决方案,1创建空白解决方案创建空白解决方案的步骤
4、如下。 (1)单击“开始”“程序”“Microsoft SQL Server 2005”“SQL Server Business Intelligence Development Studio”,打开Microsoft Visual Studio 2005开发环境。,(2)选择“文件”“新建”“项目”,弹出“新建项目”对话框,在“项目类型”中选择“Visual Studio解决方案”,在“模板”中选择“空白解决方案”。,(3)指定解决方案的名称、要保存的位置。 (4)单击“确定”按钮,就创建了一个空白解决方案。,2创建Analysis Services项目,创建Analysis Service
5、s项目的步骤如下。 (1)单击“开始”“程序”“Microsoft SQL Server 2005”“SQL Server Business Intelligence Development Studio”,打开Microsoft Visual Studio 2005开发环境。,(2)选择“文件”“新建”“项目”,弹出“新建项目”对话框,在“项目类型”中选择“Business Intelligence Projects”,在“模板”中选择“Analysis Services Project”。,(3)指定项目名称、要保存项目的位置。 (4)单击“确定”按钮,就成功创建了Analysis Ser
6、vices项目。,18.3 分析服务数据库,Microsoft SQL Server 2005 Analysis Services(SSAS)数据库用作客户端应用程序的访问和安全点,也用作Analysis Services对象(包括数据源、数据源视图、多维数据集、维度、挖掘结构、角色和程序集)的容器。,Analysis Services支持单个Analysis Services实例上有许多数据库,并且每个数据库都可根据建立商业操作和处理模型的需要包含任意多个多维数据集和维度。单个Analysis Services数据库可合并来自任意数量的数据源(关系数据源或非关系数据源)的数据。,Analys
7、is Services数据库可用作传统的OLAP解决方案,以聚合和分析商业智能数据;它还可用作将分散的异类数据源集中到连续结构中的统一维度模型(UDM)解决方案,从而使得用户能够访问和分析实时数据或历史数据。,18.3.1 创建分析服务数据库 18.3.2 修改分析服务数据库 18.3.3 删除分析服务数据库,18.4 在线分析处理,18.4.1 在线分析处理概述在线分析处理(OLAP)又称为联机分析处理,允许以一种称为多维数据集的多维结构访问来自商业数据源(如数据仓库)的经过聚合和组织整理的数据。,Microsoft SQL Server 2005 Analysis Services(SSA
8、S)提供OLAP工具和功能,可用于设计、部署和维护多维数据集及其他支持对象。,18.4.2 维度,维度是指说明由数据源视图中的表提供的数据的对象集合。这些对象(称为属性)可以组织为多个可提供多维数据集数据导航路径的层次结构。维度通常包含说明用户作为分析基础的特定主题(例如时间、客户或产品)的所有属性。,18.4.3 多维数据集,多维数据集是包含维度和度量值的多维结构。维度定义多维数据集的结构,而度量值提供最终用户感兴趣的数值。作为逻辑结构,多维数据集允许客户端应用程序检索值,仿佛多维数据集中的单元定义了每个可能的摘要值。,18.5 数 据 挖 掘,18.5.1 数据挖掘概述数据挖掘通常被称为“
9、从大型数据库提取有效、可信和可行信息的过程”。换言之,数据挖掘派生数据中存在的模式和趋势。这些模式和趋势可以被收集在一起并定义为挖掘模型。挖掘模型可以应用于特定的业务方案,例如:,预测销售额; 向特定客户发送邮件; 确定可能需要搭售的产品; 查找客户将产品放入购物车的顺序序列。数据挖掘过程可以分为以下6个步骤。,1定义问题,数据挖掘过程的第1步就是明确定义业务问题。该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的最终目标。,2准备数据,数据挖掘过程的第2步是合并和清除定义问题步骤中标识的数据。,3浏览数据,数据挖掘过程的第3步是浏览已准备的数据。,4生成模型,数据挖掘过程的第4步是生成挖掘模型。,5浏览和验证模型,数据挖掘过程的第5步是浏览已经生成的模型并测试其有效性。在将模型部署到生产环境之前,应该首先测试模型性能。,6部署和更新模型,数据挖掘过程的最后一步是将性能最佳的模型部署到生产环境。,18.5.2 创建数据挖掘模型,SQL Server 2005提供了用于创建和使用数据挖掘模型的集成环境,即Business Intelligence Development Studio。该环境包括数据挖掘算法和工具,使用这些算法和工具更易于生成用于各种项目的综合解决方案。,