1、宝剑锋从磨砺出梅花香自苦寒来,数 据 库 原 理 Theory of Database 第七章 数据库设计(续1),Theory of Database,3,第七章 数据库设计,7.1 数据库设计概述 7.2 需求分析 7.3 概念结构设计 7.4 逻辑结构设计 7.5 数据库的物理设计 7.6 数据库实施和维护 7.7 小结,Theory of Database,4,7.3.1 概念结构 7.3.2 概念结构设计的方法与步骤 7.3.3 数据抽象与局部视图设计 7.3.4 视图的集成,7.3 概念结构设计,Theory of Database,5,7.3.1 概念结构,什么是概念结构设计,将
2、需求分析得到的用户需求抽象为信息结构即概念模型 的过程就是概念结构设计;,概念结构是各种数据模型的共同基础,它比数据模型更 独立于机器、更抽象,从而更加稳定;,概念结构设计是整个数据库设计的关键。,Theory of Database,6,7.3.1 概念结构(续),Theory of Database,7,7.3.1 概念结构(续),概念结构设计的特点,(1) 能真实、充分地反映现实世界,(2) 易于理解,(3) 易于更改,(4) 易于向关系、网状、层次等各种数据模型转换,描述概念模型的工具,E-R模型,Theory of Database,8,7.3 概念结构设计,7.3.1 概念结构 7
3、.3.2 概念结构设计的方法与步骤 7.3.3 数据抽象与局部视图设计 7.3.4 视图的集成,Theory of Database,9,7.3.2 概念结构设计的方法与步骤,设计概念结构的四类方法,自顶向下:,首先定义全局概念结构的框架; 然后逐步细化。,Theory of Database,10,7.3.2 概念结构设计的方法与步骤,自底向上:,首先定义各局部应用的概念结构; 然后将它们集成起来,得到全局概念结构。,设计概念结构的四类方法,Theory of Database,11,设计概念结构的四类方法,逐步扩张:,首先定义最重要的核心概念结构; 然后向外扩充,以滚雪球的方式 逐步生成其
4、他概念结构,直至总体概念结构。,7.3.2 概念结构设计的方法与步骤,Theory of Database,12,设计概念结构的四类方法,混合策略:,将自顶向下和自底向上相结合,用自顶向下 策略设计一个全局概念结构的框架, 以它为骨架集成由自底向上策略中设计的 各局部概念结构。,7.3.2 概念结构设计的方法与步骤,Theory of Database,13,常用策略,自顶向下地进行需求分析,自底向上地设计概念结构,7.3.2 概念结构设计的方法与步骤,Theory of Database,14,7.3.2 概念结构设计的方法与步骤,自底向上设计概念结构的步骤:,第1步:抽象数据并设计局部视图
5、,第2步:集成局部视图,得到全局概念结构,Theory of Database,15,7.3 概念结构设计,7.3.1 概念结构 7.3.2 概念结构设计的方法与步骤 7.3.3 数据抽象与局部视图设计 7.3.4 视图的集成,Theory of Database,16,7.3.3 数据抽象与局部视图设计,数据抽象,局部视图设计,Theory of Database,17,数据抽象,抽象是对实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述。,概念结构是对现实世界的一种抽象。,Theory of Database,18,数据抽象(续),三种常用
6、抽象,分类(Classification),抽象了对象值和型之间的“is member of”的语义,定义某一类概念作为现实世界中一组对象的类型,Theory of Database,19,数据抽象(续),三种常用抽象,聚集(Aggregation),定义某一类型的组成成分,抽象了对象内部类型和成分之间“is part of”的语义,Theory of Database,20,数据抽象(续),三种常用抽象,聚集(Aggregation),复杂的聚集,某一类型的成分仍是一个聚集,Theory of Database,21,数据抽象(续),三种常用抽象,概括(Generalization),定义类
7、型之间的一种子集联系,抽象了类型之间的“is subset of”的语义,继承性,Theory of Database,22,局部视图设计,设计分E-R图的步骤:,选择局部应用,逐一设计分E-R图,Theory of Database,23,选择局部应用,局部视图设计(续),在多层的数据流图中选择一个适当层次的数据流图, 作为设计分E-R图的出发点;,通常以中层数据流图作为设计分E-R图的依据。,Theory of Database,24,设计分E-R图的出发点,局部视图设计(续),选择局部应用,Theory of Database,25,逐一设计分E-R图,局部视图设计(续),任务:,将各局
8、部应用涉及的数据分别从数据字典中抽取出来;,确定实体之间的联系及其类型(1:1,1:n,m:n)。,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码(根据数据字典中数据流来画数据流图);,Theory of Database,26,数据流图,局部视图设计(续),逐一设计分E-R图(续),流动数据,数据的源点或终点,数据处理应用,需要存储的数据,Theory of Database,27,局部视图设计(续),逐一设计分E-R图(续),两条准则:,(1)属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。,(2)属性不能与其他实体具有联系。联系只发生在实
9、体之间。,Theory of Database,28,职称作为一个实体,局部视图设计(续),逐一设计分E-R图(续),Theory of Database,29,病房作为一个实体,局部视图设计(续),逐一设计分E-R图(续),Theory of Database,30,仓库作为一个实体,局部视图设计(续),逐一设计分E-R图(续),Theory of Database,31,局部视图设计(续),实例销售管理子系统分E-R图的设计。,销售管理子系统的主要功能:,处理顾客和销售员送来的订单 工厂是根据订货安排生产的 交出货物同时开出发票 收到顾客付款后,根据发票存根和信贷情况进行应收款处理,The
10、ory of Database,32,销售管理子系统第一层数据流图 (虚线划出了系统边界 ),局部视图设计(续),Theory of Database,33,第二层数据流图接受订单,局部视图设计(续),Theory of Database,34,局部视图设计(续),第二层数据流图处理订单,Theory of Database,35,局部视图设计(续),第二层数据流图开发票,Theory of Database,36,局部视图设计(续),第二层数据流图支付过账,Theory of Database,37,逐一设计分E-R图,分E-R图的框架,局部视图设计(续),Theory of Databas
11、e,38,局部视图设计(续),逐一设计分E-R图,参照第二层数据流图和数据字典,遵循两个准则, 进行如下调整:,(1)订单与订单细节是1n的联系。,(2)原订单和产品的联系实际上是订单细节和产品的联系。,(3)“发票主清单”是一个数据存储,不作为实体加入分E-R图。,(4)工厂对大宗订货给予优惠。,Theory of Database,39,得到分E-R图如下图所示,销售管理子系统的分E-R图,局部视图设计(续),Theory of Database,40,局部视图设计(续),对每个实体定义的属性如下:,顾客:顾客号,顾客名,地址,电话,信贷状况,账目余额,订单:订单号,顾客号,订货项数,订货
12、日期,交货日期,工种号,生产地点,应收账款:顾客号,订单号,发票号,应收金额,支付日期,支付金额,当前余额,货款限额,折扣规则:产品号,订货量,折扣,订单细则:订单号,细则号,零件号,订货数,金额,产品描述:产品号,产品名,单价,重量,Theory of Database,41,7.3 概念结构设计,7.3.1 概念结构 7.3.2 概念结构设计的方法与步骤 7.3.3 数据抽象与局部视图设计 7.3.4 视图的集成,Theory of Database,42,7.3.4 视图的集成,各个局部视图即分E-R图建立好后, 还需要对它们进行合并,集成为一 个整体的数据概念结构即总E-R图。,The
13、ory of Database,43,视图集成的两种方式,7.3.4 视图的集成(续),多个分E-R图一次集成,一次集成多个分E-R图 通常用于局部视图比较简单时,Theory of Database,44,7.3.4 视图的集成(续),逐步集成,用累加的方式一次集成两个分E-R图,视图集成的两种方式,Theory of Database,45,7.3.4 视图的集成(续),集成局部E-R图的步骤,1. 合并2. 修改与重构,Theory of Database,46,视图集成,7.3.4 视图的集成(续),Theory of Database,47,合并分E-R图,生成初步E-R图,7.3.
14、4 视图的集成(续),各分E-R图存在冲突,各个分E-R图之间必定会存在许多不一致的地方,合并分E-R图的主要工作与关键,合理消除各分E-R图的冲突,冲突的种类,属性冲突 命名冲突 结构冲突,Theory of Database,48,属性冲突,7.3.4 视图的集成(续),属性域冲突,属性值的类型 取值范围 取值集合不同,属性取值单位冲突,Theory of Database,49,同名异义:,不同意义的对象在不同的局部应用中具有相同的名字,异名同义(一义多名):,同一意义的对象在不同的局部应用中具有不同的名字,命名冲突,7.3.4 视图的集成(续),Theory of Database,5
15、0,7.3.4 视图的集成(续),同一对象在不同应用中具有不同的抽象;,同一实体在不同分E-R图中所包含的属性个数和属性排列次序不完全相同;,实体之间的联系在不同局部视图中呈现不同的类型;,结构冲突,Theory of Database,51,消除不必要的冗余,设计基本E-R图,7.3.4 视图的集成(续),基本任务:,消除不必要的冗余,设计生成基本E-R图,Theory of Database,52,冗余 消除冗余的方法,7.3.4 视图的集成(续),消除不必要的冗余,设计基本E-R图,Theory of Database,53,1冗余,7.3.4 视图的集成(续),冗余的数据是指可由基本数
16、据导出的数据; 冗余的联系是指可由其他联系导出的联系;,冗余数据和冗余联系容易破坏数据库的完整性, 给数据库维护增加困难。,消除不必要的冗余后的初步E-R图称为基本E-R图。,Theory of Database,54,消除冗余的方法,7.3.4 视图的集成(续),分析方法,以数据字典和数据流图为依据,根据数据字典中关于数据项之间的逻辑关系,Theory of Database,55,消除冗余,7.3.4 视图的集成(续),消除冗余的方法,Theory of Database,56,7.3.4 视图的集成(续),效率与冗余信息,需要根据用户的整体需求来确定,若人为地保留了一些冗余数据,则应把数
17、据字典 中数据关联的说明作为完整性约束条件,存放量Q4=存放量Q5,一旦Q5修改后就应当触发完整性检查,对Q4进行修改,消除冗余的方法,Theory of Database,57,7.3.4 视图的集成(续),消除冗余的方法,规范化理论,函数依赖的概念提供了消除冗余联系的形式化工具。,58,劳动人事管理的分E-R图,7.3.4 视图的集成(续),规范化理论方法,确定分E-R图实体之间的数据依赖 ,并用实体码之间的函数依赖表示。,Theory of Database,59,7.3.4 视图的集成(续),规范化理论方法,上图中,,部门和职工之间一对多的联系可表示为:职工号部门号,职工和产品之间多对
18、多的联系可表示为:(职工号,产品号)工作天数,得到函数依赖集FL,Theory of Database,60,7.3.4 视图的集成(续),2. 求FL的最小覆盖GL ,差集为D = FL-GL。,规范化理论方法,逐一考察D中的函数依赖,确定是否是冗余的联系, 若是,就把它去掉。,(2) 当实体之间存在多种联系时要将实体之间的联系在形式上加以区分。,冗余的联系一定在D中,而D中的联系不一定是冗余的;,Theory of Database,61,7.3.4 视图的集成(续),实例 某工厂管理信息系统的视图集成。,物资分E-R图 销售分E-R图 人事分E-R图,系统的基本E-R图,Theory o
19、f Database,62,该厂物资管理分E-R图,7.3.4 视图的集成(续),实例 某工厂管理信息系统的视图集成。,Theory of Database,63,图7.24 销售管理子系统的分E-R图,该厂销售管理分E-R图,7.3.4 视图的集成(续),实例 某工厂管理信息系统的视图集成。,Theory of Database,64,图7.29 劳动人事管理的分E-R图,该厂劳动人事管理分E-R图,7.3.4 视图的集成(续),实例 某工厂管理信息系统的视图集成。,Theory of Database,65,系统的基本E-R图,7.3.4 视图的集成(续),实例 某工厂管理信息系统的视图集
20、成。,Theory of Database,66,集成过程,解决了以下问题: 异名同义,项目和产品含义相同; 库存管理中职工与仓库的关系已包含在劳动人事管理的部门与职工之间的联系之中,所以可以取消; 职工之间领导与被领导关系可由部门与职工(经理)之间的领导关系、部门与职工之间的从属关系两者导出,所以也可以取消;,7.3.4 视图的集成(续),Theory of Database,67,验证整体概念结构,7.3.4 视图的集成(续),视图集成后形成一个整体的数据库概念结构, 对该整体概念结构还必须进行进一步验证, 确保它能够满足下列条件:,整体概念结构内部必须具有一致性,不存在互相矛盾的表达;,
21、整体概念结构能准确地反映原来的每个视图结构,包括属性、 实体及实体间的联系;,整体概念结构能满足需要分析阶段所确定的所有要求;,Theory of Database,68,7.3.4 视图的集成(续),验证整体概念结构,整体概念结构最终还应该提交给用户,征求 用户和有关人员的意见,进行评审、修改和 优化,然后把它确定下来,作为数据库的概 念结构,作为进一步设计数据库的依据。,Theory of Database,69,概念结构设计小结,7.3.4 视图的集成(续),概念结构设计的步骤:,1.抽象数据并设计局部视图 2.集成局部视图,得到全局概念结构 3.验证整体概念结构,数据抽象,分类 聚集 概括,Theory of Database,70,7.3.4 视图的集成(续),概念结构设计小结,设计局部视图, 选择局部应用,2. 逐一设计分E-R图,标定局部应用中的实体、属性、码,实体间的联系,用E-R图描述出来,Theory of Database,71,7.3.4 视图的集成(续),概念结构设计小结,集成局部视图,1.合并分E-R图,生成初步E-R图,消除冲突,2. 修改与重构,消除不必要的冗余,设计生成基本E-R图,分析方法,规范化理论,属性冲突,命名冲突,结构冲突,Bye bye!,