1、 【数据挖掘】SQL Server 2008 Analysis Services 入门教程2012-11-29 00:14 697 人阅读 评论(0) 收藏 举报一. 创建 Analysis Services 项目 单击“开始”,依此指向“所有程序”和 Microsoft SQL Server 2008,再单击 SQL Server Business Intelligence Development Studio。将打开 Microsoft Visual Studio 开发环境 在 Visual Studio 的“文件”菜单上,指向“新建”,然后单击“项目”。 在“新建项目”对话框中,从“项目
2、类型”窗格中选择“商业智能项目”,再在“模板”窗格中选择“Analysis Services 项目” 将项目名称更改为 Analysis Services Tutorial,这也将更改解决方案名称,然后单击“确定”。您已经基于 Analysis Services 项目模板,在同样命名为 Analysis Services Tutorial 的新解决方案中成功创建了 AnalysisServices Tutorial 项目。二、定义数据源 在解决方案资源管理器中,右键单击“数据源”,然后单击“新建数据源”。 在“欢迎使用数据源向导”页上,单击“下一步”可打开“选择如何定义连接”页。 在“选择如何
3、定义连接”页上,可以基于新连接、现有连接或以前定义的数据源对象来定义数据源。在本教程中,将基于新连接定义数据源。确保已选中“基于现有连接或新连接创建数据源”,再单击“新建”。 在“连接管理器”对话框中,为数据源定义连接属性。在“提供程序”列表中,确保已选中“本机 OLE DBSQL Server Native Client 10.0”。Analysis Services 还支持“提供程序”列表中显示的其他访问接口。 在“服务器名称”文本框中,键入 localhost。要连接到本地计算机上的命名实例,请键入 localhost。若要连接到特定的计算机而不是本地计算机,请键入该计算机名称或 IP
4、地址。 确保已选中“使用 Windows 身份验证”。在“选择或输入数据库名称”列表中,选择 AdventureWorksDW2008。 单击“测试连接”以测试与数据库的连接。 单击“确定”,然后单击“下一步”。 在该向导的“模拟信息”页上,可以定义 Analysis Services 用于连接数据源的安全凭据。在选中“Windows 身份验证”时,模拟会影响用于连接数据源的 Windows 帐户。Analysis Services 不支持使用模拟功能来处理 OLAP 对象。选择“使用服务帐户”,然后单击“下一步”。 在“完成向导”页上,键入名称 Adventure Works DW,然后单击
5、“完成”以创建新数据源。三、定义数据源视图 在解决方案资源管理器中,右键单击“数据源视图”,再单击“新建数据源视图”。 在“欢迎使用数据源视图向导”页中,单击“下一步”。 此时将显示“选择数据源”页。“关系数据源”下的 Adventure Works DW 数据源已被选中。单击“下一步”。 在“选择表和视图”页上,可以从选定的数据源提供的对象列表中选择表和视图。可以筛选此列表,为选择表和视图提供帮助。在“可用对象”列表中,选择下列对象。在按住 Ctrl 键的同时单击各个表可以选择多个表:o DimCustomer (dbo)o DimDate (dbo)o DimGeography (dbo)
6、o DimProduct (dbo)o FactInternetSales (dbo) 单击 “” 符号,将选中的表添加到“包含的对象”列表中。 单击“下一步”。 在“名称” 字段中,键入 Adventure Works DW,然后单击“完成”以定义 Adventure Works DW 数据源视图。此时,Adventure Works DW 数据源视图将显示在解决方案资源管理器的“数据源视图”文件夹中。数据源视图的内容还将显示在 Business Intelligence Development Studio 的数据源视图设计器中。此设计器包含以下元素:o “关系图”窗格,其中将以图形方式显
7、示各个表及其相互关系。o “表”窗格,其中将以树的形式显示各个表及其架构元素。o “关系图组织程序”窗格,可在其中创建子关系图,用于查看数据源视图的子集。o 一个特定于数据源视图设计器的工具栏。 现在,即可在“关系图”窗格中查看所有表及其相互关系了。注意,在 FactInternetSales 表和 DimDate 表之间存在三种关系。每个销售都具有三个与其关联的日期:订单日期、到期日期和发货日期。若要查看某种关系的详细信息,可双击“关系图”窗格中的关系箭头。四、修改表的默认名字,提供更友好的名字1. 在数据源视图设计器的“表”窗格中,右键单击 FactInternetSales 表,然后单击
8、“属性”以便在 Adventure Works Tutorial 数据源视图中显示 FactInternetSales对象的属性,打开属性工具边栏。2. 将 FactInternetSales 对象的 FriendlyName 属性更改为 InternetSales。3.4. 在“表”窗格中单击 DimProduct。在“ 属性”窗口中,将 FriendlyName 属性更改为“产品”。5. 使用同样的方法更改数据源视图中剩余的各个表的 FriendlyName 属性,删除“Dim”前缀。6.7. 在“文件”菜单上,或者在 BI Development Studio 的工具栏上,单击 “全部保
9、存”,以保存截至目前已在 Analysis ServicesTutorial 项目中进行的更改。您可以根据需要在此处停止教程学习,并在以后继续。定义维度1. 在解决方案资源管理器中,右键单击“维度”,然后单击“新建维度”。2. 在“欢迎使用维度向导”页上,单击“下一步”。3. 在“选择创建方法”页上,验证是否选择了“使用现有表”选项,然后单击“下一步”。4. 在“指定源信息”页上,验证是否选择了 Adventure Works DW 数据源视图。5. 在“主表”列表中,选择“日期”。6. 单击“下一步”。7. 在“选择维度属性”页上,选中下列属性旁的复选框:o 日期键o 完整日期备用键o 英文
10、月份名称o 日历季度o 日历年o 日历半期8. 将“完整日期备用键”属性的“属性类型”列的设置从“定期”更改为“日期”。为此,请单击“属性类型”列中的“定期”。然后单击箭头展开选项。接下来,单击“日期”“日历” “日期”。单击“ 确定”。 重复这些步骤来如下更改下列属性的属性类型:o “英文月份名称”更改为“月份”o “日历季度”更改为“季度”o “日历年”更改为“年”o “日历半期”更改为“半年”9. 单击“下一步”。10. 在“完成向导”页的“预览”窗格中,可以看到“日期”维度及其属性。11. 单击“完成”按钮以完成向导。定义多维数据集及其属性1. 在解决方案资源管理器中,右键单击“多维数
11、据集”,然后单击“新建多维数据集”。2. 在“欢迎使用多维数据集向导”页上,单击“下一步”。3. 在“选择创建方法”页上,确认已选中“使用现有表”选项,然后单击“下一步”。4. 在“选择度量值组表”页上,确认已选中 Adventure Works DW 数据源视图。5. 单击“建议”允许多维数据集向导建议要用来创建度量值组的表。多维数据集向导会检查这些表并建议将 InternetSales 作为度量值组表。度量值组表(又称为事实数据表)包含您感兴趣的度量值(如已销售的单位数)。6. 单击“下一步”。7. 在“选择度量值”页上,查看在“Internet 销售”度量值组中选择的度量值,然后清除下列
12、度量值的复选框:o 促销关键字o 货币关键字o 销售区域关键字o 修订号默认情况下,该向导会选择将事实数据表中未链接到维度的所有数值列作为度量值。但这四列不是实际的度量值。前三列是将事实数据表与未在此多维数据集的初始版本中使用的维度表链接起来的键值。8. 单击“下一步”。9. 在“选择现有维度”页上,选择您以前创建的“日期”维度,然后单击“下一步”。10. 在“选择新维度”页上,选择要创建的新维度。为此,请确认已选中“客户”、“地域”和“产品” 复选框并清除InternetSales 复选框。11. 单击“下一步”。12. 在“完成向导”页上,将多维数据集的名称更改为 Analysis Ser
13、vices Tutorial。在“预览” 窗格中,可以看到 InternetSales 度量值组及其度量值,还可以看到“日期”、“客户”和“产品”维度。13. 单击“完成”按钮以完成向导。在解决方案资源管理器的 Analysis Services Tutorial 项目中,Analysis Services Tutorial 多维数据集显示在“多维数据集”文件夹中,而数据库维度则显示在“维度”文件夹中。此外,多维数据集设计器在开发环境的中央显示Analysis ServicesTutorial 多维数据集。14. 在多维数据集设计器的工具栏上,将“缩放”级别更改为 50 %,以便更轻松地查看多
14、维数据集内的维度和事实数据表。注意,事实数据表是黄色的,维度表是蓝色的。15.16. 在“文件”菜单上,单击“全部保存”。向“客户”维度中添加属性添加属性1. 打开“客户”维度的维度设计器。为此,请在解决方案资源管理器的 “维度”节点中双击“客户” 维度。2. 在“属性”窗格中,请注意多维数据集向导已经创建的“客户关键字” 和“地域关键字”属性。3.4. 在“维度结构”选项卡的工具栏上,使用“缩放” 图标以 100 % 的缩放比例查看“数据源视图”窗格中的表。5. 将“数据源视图”窗格中的以下各列拖到“属性”窗格中:o BirthDateo MaritalStatuso Gendero Ema
15、ilAddresso YearlyIncomeo TotalChildreno NumberChildrenAtHomeo EnglishEducationo EnglishOccupationo HouseOwnerFlago NumberCarsOwnedo Phoneo DateFirstPurchaseo CommuteDistance6. 将“数据源视图”窗格内“地域 ”表中的以下各列拖到“属性 ”窗格中:o Cityo StateProvinceNameo EnglishCountryRegionNameo PostalCode7. 在“文件” 菜单上,单击“全部保存”。8.向“产
16、品”维度中添加属性添加属性1. 打开“产品”维度的维度设计器。2. 在“属性”窗格中,请注意多维数据集向导创建的“产品密钥” 属性。3. 在“维度结构”选项卡的工具栏上,使用“缩放” 图标以 100 % 的缩放比例查看“数据源视图”窗格中的表。4. 将“数据源视图”窗格内“产品 ”表中的以下各列拖到“属性 ”窗格中:o StandardCosto Coloro SafetyStockLevelo ReorderPointo ListPriceo Sizeo SizeRangeo Weighto DaysToManufactureo ProductLineo DealerPriceo Class
17、o Styleo ModelNameo StartDateo EndDateo Status5. 在“文件” 菜单上,单击“全部保存”。6.在多维数据集设计器中检查多维数据集和维度的属性1. 若要打开多维数据集设计器,请双击解决方案资源管理器中“多维数据集”节点中的Analysis Services Tutorial 多维数据集。2. 在多维数据集设计器中的“多维数据集结构”选项卡的“度量值”窗格中,展开“Internet 销售”度量值组以显示所定义的度量值。3.将度量值拖到所需的顺序中可以更改它们的顺序。所创建的度量值顺序将影响某些客户端应用程序对这些度量值进行排序的方式。度量值组及其包含的
18、每个度量值都有属性,在“属性”窗口中可以编辑这些属性。4. 在多维数据集设计器中,在“多维数据集结构”选项卡的“维度”窗格中,检查Analysis Services Tutorial 多维数据集中的多维数据集维度。5.请注意,尽管在数据库级别只创建了三个维度(如解决方案资源管理器所示),但在 Analysis Services Tutorial 多维数据集内却有五个多维数据集维度。该多维数据集包含的维度比数据库多,其原因是,根据事实数据表中与日期相关的不同事实数据,“日期” 数据库维度被用作三个与日期相关的单独多维数据集维度的基础。这些与日期相关的维度也称为“角色扮演维度” 。使用三个与日期相
19、关的多维数据集维度,用户可以按照下列三个与每个产品销售相关的单独事实数据在多维数据集中组织维度:产品订单日期、履行订单的到期日期和订单发货日期。通过将一个数据库维度重复用于多个多维数据集维度,Analysis Services 简化了维度管理,降低了磁盘空间使用量,并减少了总体处理时间。6. 在“多维数据集结构”选项卡的“维度”窗格中,展开“客户”,然后单击“编辑客户”,以便在维度设计器中打开该维度。7.8. 维度设计器包含以下选项卡:“维度结构”、“属性关系”、“翻译”和“浏览器”。请注意,“维度结构”选项卡包含以下三个窗格:“属性”、“层次结构”和“数据源视图”。“维度” 中包含的属性将出
20、现在“属性”窗格中。有关详细信息,请参阅:定义维度特性、创建用户定义的层次结构、定义属性关系9. 在解决方案资源管理器中右键单击“多维数据集”节点中的Analysis Services Tutorial 多维数据集,然后单击“视图设计器”,可以切换到多维数据集设计器。10. 在多维数据集设计器中,单击“维度用法”选项卡。在此 Analysis Services Tutorial 多维数据集视图中,可以看到 “Internet 销售” 度量值组所用的多维数据集维度。此外,可以定义每个维度及使用该维度的每个度量值组之间的关系类型。11. 单击“分区”选项卡。12.多维数据集向导可以使用不带聚合的多
21、维联机分析处理 (MOLAP) 存储模式,为多维数据集定义单个分区。通过 MOLAP,所有叶级别数据和所有聚合均存储在多维数据集中,以便最大限度地提高性能。聚合是预先计算好的数据汇总,聚合可以在问题提出之前准备好答案,从而可以缩短查询响应时间。可在“分区”选项卡上定义其他分区、存储设置和写回设置。有关详细信息,请参阅分区(Analysis Services - 多维数据)、聚合和聚合设计 和设计分区存储和聚合。13. 单击“浏览器”选项卡。14.注意,由于浏览多维数据集尚未部署到 Analysis Services 实例中,因此无法对其进行浏览。此时,Analysis ServicesTuto
22、rial 项目中的多维数据集只是一个可以部署到任何 Analysis Services 实例的多维数据集定义。部署和处理多维数据集时,将在 Analysis Services 实例中创建定义的对象,然后用基础数据源的数据填充这些对象。15. 在解决方案资源管理器中,右键单击“多维数据集”节点中的Analysis Services Tutorial,然后单击“查看代码”。16.此时在 Analysis Services Tutorial.cube XML 选项卡上将显示Analysis Services Tutorial 多维数据集的 XML 代码。这是在部署期间在Analysis Servic
23、es 实例中创建多维数据集所用的实际代码。有关详细信息,请参阅如何 查看 Analysis Services 项目的 XML17. 关闭 XML 代码选项卡。部署 Analysis Services 项目1. 在解决方案资源管理器中,右键单击“Analysis Services Tutorial”项目,然后单击“属性”。将出现“Analysis Services Tutorial 属性页”对话框,并显示活动(开发)配置的属性。可以定义多个配置,每个配置可以具有不同的属性。例如,开发人员可能需要将同一项目配置为部署到不同的开发计算机,并具有不同的部署属性,如数据库名称或处理属性。注意“输出路径”
24、属性的值。该属性指定生成项目时保存项目的 XMLA 部署脚本的位置。这些脚本用于将该项目中的对象部署到Analysis Services 实例。2. 在左窗格的“配置属性”节点中,单击“部署”。3.查看项目的部署属性。默认情况下,Analysis Services 项目模板将Analysis Services 项目配置为将所有项目增量部署到本地计算机上的默认Analysis Services 实例,以创建一个与此项目同名的 Analysis Services 数据库,并在部署后使用默认处理选项处理这些对象。相关主题: 配置 Analysis Services项目属性注意:如果要将项目部署到本地
25、计算机上的命名 Analysis Services 实例或远程服务器上的实例,请将“服务器”属性更改为相应的实例名,如 。4. 单击“确定”。5. 在解决方案资源管理器中,右键单击 Analysis Services Tutoria 项目,然后单击“部署”。Business Intelligence Development Studio 将生成 Analysis Services Tutorial 项目,然后使用部署脚本将其部署到指定的 Analysis Services 实例中。部署进度将在下列两个窗口中显示:“输出”窗口和“部署进度 Analysis Services Tutorial”窗
26、口。打开“输出”窗口,如果需要,可通过单击“视图”菜单上的 “输出”实现。“输出”窗口显示部署的整体进度。“部署进度 Analysis Services Tutorial”窗口显示部署过程中每个步骤的详细信息。相关主题: 生成 Analysis Services 项目、部署 Analysis Services 项目6. 查看“输出”窗口和“部署进度 Analysis Services Tutorial”窗口的内容,验证是否已生成、部署和处理多维数据集,并且没有出现错误。7. 通过单击窗口中工具栏上的“自动隐藏”图标来隐藏“部署进度 -Analysis Services Tutorial”窗口。
27、8. 通过单击窗口中工具栏上的“自动隐藏”图标来隐藏“输出”窗口。提示:很奇怪,居然在部署的时候出错误,错误如下错误的详细内容如下:分析器: ImpersonationInfo 对象的语法不正确。如果 ImpersonateAccount 值用于 ImpersonationInfo,那么 Account 属性不能为空 。故障产程原因:这个问题是由数据源的模拟信息(Impersonation Information)引起的。解决方法:双击“数据源” ,切换到“Impersonation Information”选项进行设置,选择“default” 即可您已经将 Analysis Services
28、 Tutorial 多维数据集成功部署到 Analysis Services 的本地实例,并已对部署的多维数据集进行了处理。浏览已部署的多维数据集1. 切换到 Business Intelligence Development Studio 中的“产品”维度的“维度设计器”。为此,请双击解决方案资源管理器的“维度”节点的“产品”维度。2. 单击“浏览器”选项卡可显示 Product Key 属性层次结构的“所有”成员。在第 3 课中,您将定义“产品”维度的用户层次结构,利用此结构可浏览该维度。3. 切换到 Business Intelligence Development Studio 中的“
29、多维数据集设计器”。为此,双击解决方案资源管理器的“多维数据集”节点 Analysis Services Tutorial 多维数据集。4. 选择“浏览器”选项卡,然后在设计器的工具栏上单击重新连接图标。该设计器的左窗格会显示 Analysis Services Tutorial 多维数据集中的对象。在“浏览器”选项卡的右侧有两个窗格:上部窗格是“筛选器”窗格,下部是“数据”窗格。在接下来的课程中,您将使用多维数据集浏览器进行分析。修改度量值可以使用 FormatString 属性来定义格式设置以控制如何向用户显示度量值。在此任务中,您将为 Analysis Services Tutorial
30、 多维数据集中的货币和百分比度量值指定格式设置属性。修改多维数据集的度量值1. 切换到 Analysis Services Tutorial 多维数据集的多维数据集设计器的 “多维数据集结构”选项卡,在“度量值”窗格中展开“Internet 销售”度量值组,右键单击“订单数量”,然后单击“属性”。2. 在“属性” 窗口中,单击“自动隐藏”以阻止“属性” 窗口打开。当“属性” 窗口处于打开状态时,同时更改多维数据集中多个项的属性将更加容易。3. 在“属性” 窗口的 FormatString 列表中,键入 #,#。4. 在“多维数据集结构”选项卡的工具栏上,单击“显示度量值网格”。通过网格视图,您
31、可以同时选择多个度量值。5. 选择下列度量值之一:可以通过在按住 Ctrl 键的同时单击各个度量值的方式来选择多个度量值:o Unit Price o Extended Amount o Discount Amount o Product Standard Cost o Total Product Cost o Sales Amount o Tax Amt o Freight 6. 在“属性” 窗口的 FormatString 列表中,选择 Currency。7. 在“属性” 窗口顶部的下拉列表框中,选择 Unit Price Discount Pct 度量值,然后在 FormatString
32、 列表中选择 Percent。8. 在“属性” 窗口中,将 Unit Price Discount Pct 度量值的 Name 属性更改为“单价折扣百分比”。9. 在“度量值”窗格中,单击 Tax Amt,然后将此度量值的名称更改为 Tax Amount。10. 在“属性” 窗口中,单击“自动隐藏”以隐藏“属性” 窗口,然后在“多维数据集结构”选项卡的工具栏上单击“显示度量值树”。11. 在“文件”菜单上,单击“全部保存”。修改“客户” 维度有许多不同的方式可用来增加多维数据集中维度的用户友好性和功能。在本主题的各任务中,您将修改“客户”维度。重命名属性可以使用维度设计器的“维度结构”选项卡更
33、改属性名称。重命名属性1. 在 Business Intelligence Development Studio 中,切换到“客户”维度的“维度设计器”。为此,请在解决方案资源管理器的“维度”节点中双击“客户” 维度。2. 在“特性”窗格中,右键单击“英语国家/地区区域名”,并选择“重命名”。将该特性的名称更改为“国家/地区- 区域”。3. 以相同方法更改以下属性的名称:o “英语教育”属性 更改为“教育”o “英语教育”属性 更改为“教育”o “省/市/自治区名”属性 更改为“省/市/ 自治区”4. 在“文件” 菜单上,单击“全部保存”。创建层次结构通过将属性从“属性”窗格拖至“层次结构”窗
34、格可以创建新的层次结构。创建层次结构1. 将“国家/地区-区域”属性从“属性”窗格拖动到“层次结构”窗格中。2. 将“省/市/自治区”属性从“属性”窗格中拖动到位于“国家 /地区- 区域”级别下方的“层次结构”窗格的 单元格中。3. 将“市县”属性从“属性”窗格中拖动到位于“省/市/ 自治区 ”级别下方的“层次结构”窗格的 单元格中。4. 在“维度结构”选项卡的“层次结构”窗格中,右键单击“层次结构”的层次结构的标题栏,选择“重命名”,并键入“客户所在地域”。此层次结构的名称现在为“客户所在地域”。5. 在“文件” 菜单上,单击“全部保存”。添加命名计算可以向数据源视图的表中添加命名计算,命名计算是一个表示为计算列的 SQL 表达式。该表达式的显示形式和工作方式类似于表中的列。通过命名计算,不必修改基础数据源中的表即可扩展数据源视图中现有表的关系架构。有关详细信息,请参阅在数据源视图中定义命名计算 (Analysis Services)。添加命名计算1. 在解决方案资源管理器中双击“数据源视图”文件夹中的 Adventure Works DW 数据源视图,将其打开。2. 在“表”窗格中,右键单击 Customer,然后单击“新建命名计算”。3. 在“创建命名计算”对话框中,在“列名”框中键入 FullName,然后在“表达式”框中键入下列 CASE 语句: