1、数据仓库实验指导书信息科学与技术学院目 录实验一 数据仓库的创建 .3实验二 数据仓库的应用 14实验一 数据仓库的创建一 实验目的及要求:1. 熟悉并掌握 SQL Server 2000 Analysis Services 中的系统数据源的连接,建立相应的数据库和数据源并对其中的数据进行相应操作。2. 利用 SQL Server 2000 创建超市销售管理系统数据仓库。二 实验内容:1. 建立系统数据源连接Microsoft Windows NT 4.0 用户:单击“开始”按钮,指向“设置” ,单击“控制面板” ,然后双击“数据源 (ODBC)” 。 Windows 2000 用户:单击“开
2、始”按钮,指向“设置” ,单击“控制面板” ,然后双击“管理工具” ,再双击“数据源 (ODBC)” 。 在“系统 DSN”选项卡上单击“添加”按钮。 选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完成”按钮。 在“数据源名”框中,输入“教程” ,然后在“数据库”下,单击“选择” 。 在“选择数据库”对话框中,浏览到“C:Program FilesMicrosoft Analysis ServicesSamples”,然后单击“FoodMart 2000.mdb”。单击“确定”按钮。 在“ODBC Microsoft Access 安装”对话框中单击“确定”按钮
3、。 在“ODBC 数据源管理器”对话框中单击“确定”按钮。2. 启动 Analysis Manager单击“开始”按钮,依次指向“程序” 、 “Microsoft SQL Server”和“Analysis Services” ,然后单击“Analysis Manager” 。3. 建立数据库和数据源在 Analysis Manager 树视图中展开“Analysis Servers” 。 单击服务器名称,即可建立与 Analysis Servers 的连接。 右击服务器名称,然后单击“新建数据库”命令。 在“数据库”对话框中的“数据库名称”框中,输入“教程” ,然后单击“确定”按钮。 在 A
4、nalysis Manager 树窗格中展开服务器,然后展开刚才创建的“教程”数据库。新的“教程”数据库包含下列项目: 数据源 多维数据集 共享维度 挖掘模型 数据库角色然后,建立到“教程”数据源中的示例数据的连接。教程中的全部练习都将使用这个示例。 在 Analysis Manager 中建立一个数据源,将数据库连接到在 ODBC 数据源管理器中建立的系统数据源名称 (DSN) 上。在建立多维数据集的过程中,所有的数据都将来自这个源。如何建立数据源:在 Analysis Manager 树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。 在“数据链接属性”对话框中,
5、单击“提供者”选项卡,然后单击“Microsoft OLE DB Provider for ODBC Drivers”。 单击“连接”选项卡,然后从“使用数据源名称”列表中单击“教程” 。 单击“测试连接”以确保一切工作正常。在“Microsoft 数据链接”对话框中应出现一条消息,说明连接成功。在消息框中单击“确定”按钮。 单击“确定”按钮关闭“数据链接属性”对话框。4. 建立多维数据集如何打开多维数据集向导:在 Analysis Manager 树窗格中, “教程”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。 如何向多维数据集添加度量值:度量值是要
6、进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。 在“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998” 。 单击“浏览数据”按钮可以查看“sales_fact_1998”表中的数据。数据浏览完毕后,关闭“浏览数据”窗口,然后单击“下一步”按钮。 若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“store_sales”。对“store_cost”和“unit_sales”列重复此步骤,然后单击“下一步”按钮。 如何建立时间维度:
7、在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。此操作将调用维度向导。 在“欢迎”步骤,单击“下一步”按钮。 在“选择维度的创建方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。 在“选择维度表”步骤,单击“time_by_day” 。单击“浏览数据”按钮可以查看包含在“time_by_day”表中的数据。 查看完“time_by_day”表后,单击“下一步”按钮。 在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。 接下来,将定义维度的级别。在“创建时间维度级别”步骤,单击“选择时间级别” ,单击“年、季度、月” ,然后单击“下一步”按钮。
8、 在“选择高级选项”步骤,单击“下一步”按钮。 在向导的最后一步,输入“Time”作为新维度的名称。注意: 使用“与其它多维数据集共享此维度”复选框,可以指定此维度是共享的,还是专用的。该复选框位于屏幕的左下角。 保持该复选框的选中状态。如何建立产品维度:再次单击“新建维度”命令。在“欢迎进入维度向导”步骤,单击“下一步”按钮。 在“选择创建维度的方式”步骤,选择“雪花架构: 多个相关维度表”选项,然后单击“下一步”按钮。 在“选择维度表”步骤,双击“Product”和“product_class”将它们添加到“选定的表” 。单击“下一步”按钮。 在维度向导的“创建和编辑联接”步骤,显示在上一
9、步选定的两个表以及它们之间的联接。单击“下一步”按钮。 若要定义维度的级别,在“可用的列”下,按顺序双击“product_category”、 “product_subcategory”和“brand_name” 。双击每列后,其名称显示在“维度级别”下。在选择了所有三列后,单击“下一步”按钮。 在“指定成员键列”步骤,单击“下一步”按钮。 在“选择高级选项”步骤,单击“下一步”按钮。 在向导的最后一步,在“维度名称”框中,输入“Product” ,并保持“与其它多维数据集共享此维度”复选框为选中状态。单击“完成”按钮。 现在应能在“多维数据集维度”列表中看到“Product”维度。如何建立客
10、户维度:单击“新建维度”命令。 在“欢迎”步骤,单击“下一步”按钮。 在“选择创建维度的方式”步骤,选择“星型架构: 单个维度表”选项,然后单击“下一步”按钮。 在“选择维度表”步骤,单击“Customer” ,然后单击“下一步”按钮。 在“选择维度类型”步骤,单击“下一步”按钮。 若要定义维度的级别,在“可用列”下,按顺序双击“Country” 、“State_Province”、 “City”和“lname”列。 双击每一列后,其名称将显示在“维度级别”下方。选择完所有四个列之后,单击“下一步”按钮。 在“指定成员键列”步骤,单击“下一步”按钮。 在“选择高级选项”步骤,单击“下一步”按钮
11、。 在向导的最后一步,在“维度名称”框中,输入“Customer” 。保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Customer”维度。 如何生成商店维度单击“新建维度”命令。 在“欢迎”步骤,单击“下一步”按钮。 在“选择创建维度的方式”步骤,选择“星型架构: 单个维度表”选项,然后单击“下一步”按钮。 在“选择维度表”步骤,单击“Store” ,然后单击“下一步”按钮。在“选择维度表”步骤,单击“Store” ,然后单击“下一步”按钮。若要定义维度的级别,在“可用列”下,按顺序双击“store_cou
12、ntry”、 “store_state”、 “store_city”和“store_name”列。 双击每一列之后,其名称将显示在“维度级别”框下。选择了所有四个列之后,单击“下一步”按钮。 在“指定成员键列”步骤,单击“下一步”按钮。 在“选择高级选项”步骤,单击“下一步”按钮。 在向导的最后一步,在“维度名称”框中,输入“Store” ,并保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Store”维度。如何完成多维数据集的生成:在多维数据集向导中,单击“下一步”按钮。 在“事实数据表行数”消息给出提示时,
13、单击“是”按钮。 在多维数据集向导的最后一步,将多维数据集命名为“Sales” ,然后单击“完成”按钮。 向导将关闭并随之启动多维数据集编辑器,其中包含刚刚创建的多维数据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子。 实验二 数据仓库的应用一 实验目的及要求1.利用 Analysis Manger services 对已建立的维进行操作,并对多维数据集完成最终的设计存储和处理,并浏览数据集中的数据。2.利用 SQL Server 2000 中的 Analysis Manger 进行数据分析与挖掘。二 实验内容1. 编辑多维数据集:如何在多维数据集编辑器内编辑多维数据集:可以
14、使用以下两种方法启用多维数据集编辑器: 在 Analysis Manager 树窗格中右击一个现有的多维数据集,然后单击“编辑”命令。使用多维数据集编辑器直接创建新的多维数据集。除非您是高级用户,否则不建议使用本方法。如果您是从上一节的操作接着下来的,则应该已经在多维数据集编辑器中。 在多维数据集编辑器的“架构”窗格中,可以看到事实数据表(黄色标题栏)及联接的维度表(蓝色标题栏) 。在多维数据集编辑器树窗格中,可以在层次树中预览多维数据集的结构。通过单击左窗格中底部的“属性”按钮,可以编辑多维数据集的属性。 如何向现有多维数据集添加维度:此时,您可能需要一个新维度以提供有关产品促销的数据。在多
15、维数据集编辑器内可以方便地生成该维度。注意:默认情况下,在多维数据集编辑器中生成的维度为专用维度,即只能用于当前所处理的多维数据集,而不能与其它多维数据集共享。它们不显示在 Analysis Manager 树视图中的“共享维度”文件夹中。当通过维度向导创建此类维度时,可以使其在多维数据集之间共享。 在多维数据集编辑器中,在“插入”菜单上单击“表”命令。 在“选择表”对话框中,单击“promotion”表,单击“添加”按钮,然后单击“关闭”按钮。 若要定义新的维度,请双击“promotion”表中的“promotion_name”列。 在“映射列”对话框中选择“维度”选项,然后单击“确定”按钮
16、。在树视图中选择“Promotion Name”维度。 在“编辑”菜单中单击“重命名”命令。 键入“Promotion” ,按 ENTER 键。 保存所做的更改。 关闭多维数据集编辑器。当系统提示您是否设计存储时,单击“否” 。您将在下节中设计存储。 2. 设计存储和处理多维数据集如何使用存储设计向导设计存储:在 Analysis Manager 树窗格中,在“教程”数据库下展开“多维数据集”文件夹,右击“Sales”多维数据集,然后单击“编辑”命令。 在“欢迎”步骤中单击“下一步”按钮。 选择“MOLAP”作为数据存储类型,然后单击“下一步”按钮。 在“设置聚合选项”下单击“性能提升达到”
17、。在此框中输入“40”作为指定百分比。 此操作指示 Analysis Services 将性能提升到 40%,而不管需要多大的磁盘空间。管理员可以用此优化能力平衡查询性能需求和存储聚合数据所需磁盘空间大小。单击“启动”按钮。 在 Analysis Services 设计聚合时,您可以查看向导右边的“性能与大小”图。从中可以看出增加性能提升对使用额外磁盘空间的需求。完成设计聚合的进程之后,单击“下一步”按钮。 在“您希望做什么?”下选择“立即处理” ,然后单击“完成”按钮。注意:处理聚合可能会花费一些时间。 在处理时可以在出现的窗口中查看多维数据集。处理完成之后将出现一则信息,确认处理已成功完成
18、。 单击“关闭”按钮返回 Analysis Manager 树窗格。3. 浏览多维数据集数据如何使用多维数据集浏览器查看多维数据集数据:在 Analysis Manager 树窗格中,右击“Sales”多维数据集,然后单击“浏览数据”命令。 出现多维数据集浏览器,显示由多维数据集的一个维度和度量值组成的网格。其它四个维度显示在浏览器的上方。如何替换网格中的维度:要用另一个维度替换网格中的维度,拖动上方框中的维度,然后直接将该维度放在要与其交换的列上。确保在此过程中,指针的形状为双端箭头。 使用这种拖放方法,选择“Product”维度按钮并将其拖动到网格上,然后直接放在“Measures”上方。
19、 “Product”维度和“Measures”维度在多维数据集浏览器中将交换位置。 注意: 如果想将维度添加到网格,而不是用另一个维度进行替换,则将该维度拖动到网格的中间。如何按时间筛选数据:单击“Time”维度旁边的箭头。 展开“所有 Time”和“1998”节点,然后单击“Quarter 1”。将对网格中的数据进行筛选,使筛选出的数据为仅反映该季度情况的数字。 如何深化:使用拖放方法交换“Product”和“Customer”维度。单击“Product”并将其拖到“Country”维度上。 双击网格中包含“Baking Goods”的单元。多维数据集展开以包括子类别列。 注意:双击已经展开的单元可以关闭子类别列。 用上述方法使维度在网格上来回移动。这有助于了解如何使用 Analysis Manager 将有关复杂数据关系的信息信手拈来。 完成后,单击“关闭”按钮关闭多维数据集浏览器。