1、OLAP 与数据仓库设计实验报告模板姓名 周靖峰 李卓专业 大数据学号 21651009 21651014实验日期 2016.10.11实验简要说明 本次试验主要是进行数据仓库的简要设计教师评分实验目的本次试验的目的是能够根据所提供的样例数据库设计数据仓库,熟悉构建数据仓库的星型模型。实验环境本次试验除了需要一台计算机,具体要求如下:操作系统:不限,可以使 windows 也可以是 Linux。内存:建议大于 512M。硬盘:30G 及其以上。对于数据库方面提供相应的样例数据库。具体如下:1)采用数据库mysql2)采用 MySQL 提供的样例数据库employees。可以参见:http:/
2、或者employee 样例数据库说明.pdf如下图:数据库的下载和安装需要自己手动到该网站进行下载,试验中不提供数据库的安装脚本和数据。试验任务根据样例数据库的 ER 图:我们提出以下基本需求:1)公司每个员工每月的薪资分别是多少?2)哪些部门每个月开出的薪资比较高?3)哪种职称的每月得到的薪资比较高?其他的需求可以自己补充。根据上述简单需求建立星型模型。实验步骤1、安装 mysql,并将 mysql 的 bin 目录加到 PATH 环境变量中2、访问 https:/ employees-db-full 压缩包,解压该压缩包,然后用命令行进入解压后的路径,输入命令 mysql -u root
3、-p -t ER 图表,显示 ER 图4、观察表结构,根据需求建立星型模型实验结果星型模型如下:实验总结本次实验让我们对于数据仓库中的事实表与维度表了解的更加清楚。通过对已给的数据库结构进行了分析,进而得出了数据库中各个表的结构关系,进而确定事实表中的外键与维度表中的主键。这个研究与学习的过程让我们更好地理解了星型模型。本次实验有以下几点不足之处:首先,对于维度的了解不够深入,导致只能够从已有的数据库中的属性抽取出一些字段,添加的字段比较少。再者,星型模型中共有四个维度表,只能满足基本的需求问题,不够复杂,不能够满足更加高级复杂的设计过程。最后,对于时间维度表认识不清,没有建立很详细的时间维度表,以后会在这方便加深研究。