1、1,数据库系统概论 An Introduction to Database System第七章 数据库设计,2,第七章 数据库设计,7.1 数据库设计概述 7.2 需求分析 7.3 概念结构设计 7.4 逻辑结构设计 7.5 数据库的物理设计 7.6 数据库实施和维护 7.7 小结,3,数据库设计概述(续),什么是数据库设计 数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求) 在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。,4,数据库设计人员应该具备的技术和知识,数据库的基本
2、知识和数据库设计技术 计算机科学的基础知识和程序设计的方法和技巧 软件工程的原理和方法 应用领域的知识,5,7.1 数据库设计概述,7.1.1 数据库设计的特点 7.1.2 数据库设计方法 7.1.3 数据库设计的基本步骤 7.1.4 数据库设计过程中的各级模式,返回,6,7.1.1 数据库设计的特点,数据库建设的基本规律 三分技术,七分管理,十二分基础数据 数据库设计应该与应用系统设计相结合 结构(数据)设计:设计数据库框架或数据库结构 行为(处理)设计:设计应用程序、事务处理等,7,7.1.2 数据库设计方法简述,手工试凑法 设计质量与设计人员的经验和水平有直接关系 缺乏科学理论和工程方法
3、的支持,工程的质量难以保证 使数据库设计成为一种技艺而不是工程技术 数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价,8,数据库设计方法简述(续),规范设计法 运用软件工程思想,按一定的设计规程用工程化方法设计数据库。 从本质上看仍是手工设计方法 基本思想 过程迭代和逐步求精(P202图7.2),9,数据库设计方法简述(续),规范设计法(续) 典型方法 新奥尔良(New Orleans)方法将数据库设计分为四个阶段 基于E-R模型的数据库设计方法 概念设计阶段广泛采用 3NF(第三范式)的设计方法 逻辑阶段可采用的有效方法 ODL(Object Definition Langu
4、age)方法 面向对象的数据库设计方法,10,数据库设计方法简述(续),计算机辅助设计法指在数据库设计的某些过程中模拟某一规范化设计的方法,并以人的知识或经验为主导,通过人机交互方式实现设计中的某些部分。 计算机辅助软件工程(Computer Aided Software Engineering,CASE)工具 SYSBASE公司的PowerDesigner Oracle公司的Design 2000。,返回,11,7.1.3 数据库设计的基本步骤,一、数据库设计的准备工作 选定参加设计的人员 数据库分析设计人员 应用开发人员 数据库管理人员 用户代表,12,数据库设计的基本步骤(续),二、数据
5、库设计的过程(六个阶段) 需求分析阶段 准确了解与分析用户需求(包括数据与处理) 是整个设计过程的基础,是最困难、最耗费时间的一步,13,数据库设计的基本步骤(续),概念结构设计阶段 是整个数据库设计的关键 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型,14,数据库设计的基本步骤(续),逻辑结构设计阶段 将概念结构转换为某个DBMS所支持的数据模型 对其进行优化 数据库物理设计阶段 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法),15,数据库设计的基本步骤(续),数据库实施阶段 运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理
6、设计的结果 建立数据库 编制与调试应用程序 组织数据入库 并进行试运行,16,数据库设计的基本步骤(续),数据库运行和维护阶段 数据库应用系统经过试运行后即可投入正式运行。 在数据库系统运行过程中必须不断地对其进行评价、调整与修改。,17,数据库设计的基本步骤(续),设计一个完善的数据库应用系统往往是上述六个阶段的不断反复P202图7.2,18,返回,19,7.1.4 数据库设计过程中的各级模式,数据库各级模式的形成过程(P205图7.4) 需求分析阶段综合各个用户的应用需求 概念设计阶段形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图),20,数据库设计的基本步骤(续),逻辑设
7、计阶段 首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式 然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式 物理设计阶段 根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式,21,7.2 需求分析,需求分析就是分析用户的需要与要求 需求分析是设计数据库的起点 需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用 结果得到数据字典描述的数据需求和数据流图描述的处理需求,22,7.2 需求分析,7.2.1 需求分析的任务 7.2.2
8、需求分析的方法 7.2.3 数据字典,23,7.2.1 需求分析的任务,通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求。在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库。,24,需求分析的任务(续),需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。1.信息要求 用户需要从数据库中获得信息的内容与性质 由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据,25,2.处理要求 对处理功能的要求 对处理的响应时间的要求
9、对处理方式的要求(批处理 / 联机处理) 3.安全性与完整性要求,需求分析的任务(续),26,确定用户最终需求的难点 用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。 设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。 新的硬件、软件技术的出现也会使用户需求发生变化。,需求分析的任务(续),27,解决方法 设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求,需求分析的任务(续),返回,28,7.2.2 需求分析的方法,调查清楚用户的实际需求并进行初
10、步分析与用户达成共识进一步分析与表达这些需求,29,调查用户需求的具体步骤, 调查组织机构情况组织部门的组成情况各部门的职责等,30,调查用户需求的具体步骤(续), 调查各部门的业务活动情况。调查重点之一。各个部门输入和使用什么数据如何加工处理这些数据输出什么信息输出到什么部门输出结果的格式是什么,31,调查用户需求的具体步骤(续), 在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。信息要求处理要求完全性与完整性要求,32,调查用户需求的具体步骤(续), 对前面调查的结果进行初步分析 确定新系统的边界 确定哪些功能由计算机完成或将来准备让计算机完成 确定哪些活动由人工完成
11、 由计算机完成的功能就是新系统应该实现的功能,33,常用调查方法,常用调查方法 跟班作业 通过亲身参加业务工作了解业务活动的情况 能比较准确地理解用户的需求,但比较耗时 开调查会 通过与用户座谈来了解业务活动情况及用户需求 请专人介绍,34,常用调查方法(续),询问 对某些调查中的问题,可以找专人询问 设计调查表请用户填写 如果调查表设计合理,则很有效,且易于为用户接受 查阅记录 查阅与原系统有关的数据记录,35,进一步分析和表达用户需求,分析和表达用户的需求的常用方法 自顶向下的结构化分析方法(Structured Analysis,简称SA方法) SA方法从最上层的系统组织机构入手,采用逐
12、层分解的方式分析系统,并用数据流图和数据字典描述系统。,36,进一步分析和表达用户需求(续),1首先把任何一个系统都抽象为:例,数据流,数据流,数据 存储,信息要求,数据 来源,处理,数据 输出,处理要求,37,进一步分析和表达用户需求(续),2分解处理功能和数据 (1)分解处理功能 将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。 (2)分解数据 在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图。数据流图表达了数据和处理过程的关系。,38,进一步分析和表达用户需求(续),(3)表达方法处理过程:用判定表或判定树来描述数据
13、:用数据字典来描述 3将分析结果再次提交给用户,征得用户的认可,39,数据流图,数据流图是描述数据在系统中流动和处理的工具,表达了数据与处理的关系。 数据流图(Data Flow Diagram)简称DFD,它是一种描述“分解”的图示工具。它用直观的图形清晰地描绘了系统的逻辑模型,图中只是描述数据在系统中的流动和处理的情况,具有直观、形象、容易理解的优点。,40,数据流图(续),数据源点或终点(用矩形表示); 数据存储(用双直线段或 表示) ; 处理(用圆表示); 数据流(用箭头表示)。,41,数据流图(续),画数据流图(DFD)步骤: 首先画系统的输入输出,即先画顶层数据流图。顶层图只包含一
14、个加工,用以表示被开发的系统。 画系统内部,即画下层数据流图。一般将层号从0号开始编号,采用自顶向下,由外向内的原则。画下层数据流图时,则分解上层图中的处理,一般沿着输出入流的方向,凡数据流的组成或值发生变化的地方则设置一个处理,一直进行到输出数据流。如果处理的内部还有数据流,则继续分解,直到每个处理足够简单,不能再分解为止。不能分解的处理称为基本处理。,42,数据流图(续),数据流图(DFD)注意事项: 两个处理之间可能有多个数据流 编号:如果一张数据流图中的某个加工分解成另一张数据流图时,则上层图为父图,直接下层图为子图。子图及其所有的加工都应编号。 数据流名称只能是名词或名词短语, 处理
15、命名一般为动宾结构 同一数据流可流向不同的加工,不同的加工可以流出相同的数据流 流入流出简单存储的数据流不需要命名,43,例 销售管理系统数据流图,44,判定树与判定表,例如,“检查订购单”的处理逻辑是:“ 如果金额超过500元,又未过期,则发出批准单和提货单; 如果金额超过 500元,但过期了,则不发批准单; 如果金额低于 500元,则不论是否过期都发出批准单和提货单,在过期的情况下还需发出通知单”。,45,判定树与判定表(续),46,判定树与判定表(续),判定树本质上同判定表是一样的,当用户不易接受判定表这种描述方式时,我们可以用判定树的形式,判定树是一种图形表示,更易被用户理解。,47,
16、7.2.3 数据字典,一、数据字典的用途 二、数据字典的内容,48,一、数据字典的用途,数据字典是各类数据描述的集合 数据字典是进行详细的数据收集和数据分析所获得的主要结果 数据字典在数据库设计中占有很重要的地位,返回,49,二、数据字典的内容,数据字典的内容 数据项 数据结构 数据流 数据存储 处理过程数据项是数据的最小组成单位若干个数据项可以组成一个数据结构数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。,50, 数据项,数据项是不可再分的数据单位对数据项的描述数据项描述数据项名,数据项含义说明, 别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系取值范
17、围、与其他数据项的逻辑关系定义了数据的完整性约束条件,51,数据项举例,例:学生学籍管理子系统的数据字典。 数据项 以“学号”为例:数据项: 学号含义说明:唯一标识每个学生别名: 学生编号类型: 字符型长度: 8取值范围:00000000至99999999取值含义:前两位标别该学生所在年级,后六位按顺序编号与其他数据项的逻辑关系:,52, 数据结构,数据结构反映了数据之间的组合关系。一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。对数据结构的描述数据结构描述数据结构名,含义说明,组成:数据项或数据结构,53,数据结构举例,数据结构 以“学生”
18、为例“学生”是该系统中的一个核心数据结构:数据结构: 学生含义说明: 是学籍管理子系统的主体数据结构,定义了一个学生的有关信息组成: 学号,姓名,性别,年龄,所在系,年级,54, 数据流,数据流是数据结构在系统内传输的路径。对数据流的描述数据流描述数据流名,说明,数据流来源,数据流去向,组成:数据结构,平均流量,高峰期流量 数据流来源是说明该数据流来自哪个过程 数据流去向是说明该数据流将到哪个过程去 平均流量是指在单位时间(每天、每周、每月等)里的传输次数 高峰期流量则是指在高峰时期的数据流量,55,数据流举例,数据流“体检结果”可如下描述:数据流: 体检结果说明: 学生参加体格检查的最终结果
19、数据流来源:体检数据流去向:批准组成: 平均流量: 10000次左右 高峰期流量:经常在学期开学初进行体检时,56, 数据存储,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。 对数据存储的描述数据存储描述数据存储名,说明,编号,流入的数据流 ,流出的数据流 ,组成:数据结构,数据量,存取方式 流入的数据流:指出数据来源 流出的数据流:指出数据去向 数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息 存取方法:批处理 / 联机处理;检索 / 更新;顺序检索 / 随机检索,57,数据存储举例,数据存储“学生登记表”可如下描述:数据存储: 学生登记表说明: 记录学生的
20、基本情况流入数据流:流出数据流:组成: 数据量: 每年3000张存取方式: 随机存取,58, 处理过程,处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息 处理过程说明性信息的描述处理过程描述处理过程名,说明,输入:数据流,输出:数据流,处理:简要说明,59,处理过程(续),简要说明:主要说明该处理过程的功能及处理要求 功能:该处理过程用来做什么 处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等 处理要求是后面物理设计的输入及性能评价的标准,60,处理过程举例,处理过程“分配宿舍”可如下描述:处理过程:分配宿舍说明: 为所有
21、新生分配学生宿舍输入: 学生,宿舍,输出: 宿舍安排处理: 在新生报到后,为所有新生分配学生宿舍。要求同一间宿舍只能安排同一性别的学生,同一个学生只能安排在一个宿舍中。每个学生的居住面积不小于3平方米。安排新生宿舍其处理时间应不超过15分钟。,61,四、需求分析小结,需求分析过程图,62,需求分析小结(续),分析用户活动涉及的数据,产生数据流图 深入分析用户的业务处理,以数据流图的形式表示出数据的流向和对数据所进行的加工。 分析系统数据,产生数据字典 数据字典是对数据描述的集中管理,它的功能是存储和检索各种数据描述(称为元数据Metadata)。对数据库设计来说,数据字典是进行详细的数据收集和
22、数据分析所获得的主要成果。,63,数据库系统概论 An Introduction to Database System第七章 数据库设计(续),64,7.3 概念结构设计,7.3.1 概念结构设计 7.3.2 概念结构设计的方法与步骤 7.3.3 数据抽象与局部视图设计 7.3.4 视图的集成 本节小结,65,7.3.1 概念结构,什么是概念结构设计 需求分析阶段描述的用户应用需求是现实世界的具体需求 将需求分析得到的用户需求,抽象为信息结构即概念模型的过程就是概念结构设计 概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定 概念结构设计是整个数据库设计的关键,返
23、回,66,概念结构,DBMS支持的数据模型,概念模型,认识 抽象,信息世界,机器世界,现实世界中客观对象的抽象过程,现实世界,需求分析,概念结构设计,67,概念结构(续),概念结构设计的特点 (1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。 (2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。 (3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。 (4)易于向关系、网状、层次等各种数据模型转换。,68,7.3.2 概念结构设计的方法与步骤,设计概念结构的四类方法
24、自顶向下首先定义全局概念结构的框架,然后逐步细化,69,7.3.2 概念结构设计的方法与步骤,设计概念结构的四类方法 自底向上首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构,70,概念结构设计的方法与步骤(续),逐步扩张首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构,71,概念结构设计的方法与步骤(续),混合策略将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。,72,概念结构设计的方法与步骤(续),常用策略(P211图7.8) 自顶向下地进行需求分析
25、自底向上地设计概念结构自底向上设计概念结构的步骤(P211图7.9) 第1步:抽象数据并设计局部视图 第2步:集成局部视图,得到全局概念结构,返回,73,7.3.3 数据抽象与局部视图设计,数据抽象 局部视图设计,74,数据抽象,概念结构是对现实世界的一种抽象 从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节 把这些特性用各种概念精确地加以描述 这些概念组成了某种模型,75,数据抽象(续),三种常用抽象 1. 分类(Classification) 定义某一类概念作为现实世界中一组对象的类型 这些对象具有某些共同的特性和行为 它抽象了对象值和型之间的“is member of”的
26、语义 在E-R模型中,实体型就是这种抽象 例:P212图7.10,76,77,数据抽象(续),2. 聚集(Aggregation) 定义某一类型的组成成分 它抽象了对象内部类型和成分之间“is part of”的语义 在E-R模型中若干属性的聚集组成了实体型,就是这种抽象 例:P212图7.11,图7.12,78,79,数据抽象(续),复杂的聚集,某一类型的成分仍是一个聚集,更复杂的聚集,80,数据抽象(续),3. 概括(Generalization) 定义类型之间的一种子集联系 它抽象了类型之间的“is subset of”的语义 概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象
27、。例:P213图7.130,81,82,数据抽象(续),数据抽象的用途 对需求分析阶段收集到的数据进行分类、组织(聚集),形成 实体 实体的属性,标识实体的码 确定实体之间的联系类型(1:1,1:n,m:n),返回,83,局部视图设计,设计分E-R图的步骤: 选择局部应用 逐一设计分E-R图,返回,84,1.选择局部应用,需求分析阶段,已用多层数据流图和数据字典描述了整个系统。 设计分E-R图首先需要根据系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图,让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分E-R图。,85,选择局部应用(续),通常以中层数据流
28、图作为设计分E-R图的依据。原因: 高层数据流图只能反映系统的概貌 中层数据流图能较好地反映系统中各局部应用的子系统组成 低层数据流图过细,86,选择局部应用(续),返回,87, 逐一设计分E-R图,任务 标定局部应用中的实体、属性、码,实体间的联系 将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(1:1,1:n,m:n),88,逐一设计分E-R图(续),如何抽象实体和属性 实体:现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和实体之间是“is member of“的关系。 例:在
29、学校环境中,可把张三、李四等对象抽象为学生实体。,89,逐一设计分E-R图(续),属性:对象类型的组成成分可以抽象为实体的属性。组成成分与对象类型之间是“is part of“的关系。 例:学号、姓名、专业、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码。,90,逐一设计分E-R图(续),如何区分实体和属性 一般原则 属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。 属性不能与其他实体具有联系。联系只发生在实体之间。 符合上述两条特性的事物一般作为属性对待。,91,逐一设计分E-R图(续),实体与属性是相对而言的。同一事物,在一种应用环境中作为“属
30、性”,在另一种应用环境中就可能作为“实体”。 例:学校中的系,在某种应用环境中,它只是作为“学生”实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。 为了简化E-R图的处置,现实世界中的事物凡能够作为属性对待的,应尽量作为属性。,92,逐一设计分E-R图(续),职称作为一个实体,93,逐一设计分E-R图(续),病房作为一个实体,94,逐一设计分E-R图(续),设计分E-R图的步骤 (1)以数据字典为出发点定义E-R图。数据字典中的“数据结构”、“数据流”和“数据存储”等已是若干属性的有意义的聚合 (2)
31、按上面给出的准则进行必要的调整。,95,逐一设计分E-R图(续),实例销售管理子系统分E-R图的设计 销售管理子系统的主要功能: 处理顾客和销售员送来的订单 工厂是根据订货安排生产的 交出货物同时开出发票 收到顾客付款后,根据发票存根和信贷情况进行应收款处理,96,逐一设计分E-R图(续),下图是第一层数据流图,虚线部分划出了系统边界,图7.18 销售管理子系统第一层数据流图,97,逐一设计分E-R图(续),上图中把系统功能又分为4个子系统,下面四个图是第二层数据流图,图7.19 接收订单,98,逐一设计分E-R图(续),图7.20 处理订单,99,逐一设计分E-R图(续),图7.21 开发票
32、,100,逐一设计分E-R图(续),图7.22 支付过账,101,逐一设计分E-R图(续),分E-R图的框架,102,逐一设计分E-R图(续),参照第二层数据流图和数据字典,遵循两个准则,进行如下调整: (1) 订单与订单细节是1n的联系 (2) 原订单和产品的联系实际上是订单细节和产品的联系。 (3) 图7.21中“发票主清单”是一个数据存储,不必作为实体加入分E-R图 (4) 工厂对大宗订货给予优惠,103,逐一设计分E-R图(续),得到分E-R图如下图所示,销售管理子系统的分E-R图,104,逐一设计分E-R图(续),对每个实体定义的属性如下: 顾客:顾客号,顾客名,地址,电话,信贷状况
33、,账目余额 订单:订单号,顾客号,订货项数,订货日期,交货日期,工种号,生产地点 订单细则:订单号,细则号,零件号,订货数,金额 应收账款:顾客号,订单号,发票号,应收金额,支付日期,支付金额,当前余额,货款限额 产品描述:产品号,产品名,单价,重量 折扣规则:产品号,订货量,折扣,105,7.3.4 视图的集成,各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总E-R图。,106,视图的集成(续),视图集成的两种方式 一次集成(P219图7.25(a)) 一次集成多个分E-R图 通常用于局部视图比较简单时 逐步累积式(P219图7.25(b)) 首先集成
34、两个局部视图(通常是比较关键的两个局部视图) 以后每次将一个新的局部视图集成进来,107,视图的集成(续),集成局部E-R图的步骤 1. 合并 2. 修改与重构,返回,108,一、合并分E-R图,生成初步E-R图,局部应用所面向问题不同,由不同设计人员进行局部设计,导致存在许多不一致的地方: 各分E-R图之间的冲突主要有三类: 属性冲突、命名冲突和结构冲突。 解决方法是根据应用的语义对实体联系的类型进行综合或调整。,109, 属性冲突,两类属性冲突 属性域冲突:属性值的类型、取值范围或取值集合不同。 例1, 由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用参与运算
35、,因此另一些部门(即局部应用)将学号定义为字符型形式。 例2, 某些部门(即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。,110,属性冲突(续),属性取值单位冲突。例:学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。属性冲突的解决方法 通常用讨论、协商等行政手段加以解决,111, 命名冲突,两类命名冲突 同名异义:不同意义的对象在不同的局部应用中具有相同的名字 例:局部应用A中将教室称为房间局部应用B中将学生宿舍称为房间 异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字 例:有的部门把教科书称为课本有的部门则把教
36、科书称为教材,112,命名冲突(续),命名冲突可能发生在属性级、实体级、联系级上。其中属性的命名冲突更为常见。 命名冲突的解决方法 通过讨论、协商等行政手段加以解决,113, 结构冲突,三类结构冲突 同一对象在不同应用中具有不同的抽象 例:“课程”在某一局部应用中被当作实体,在另一局部应用中则被当作属性 解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的抽象。变换时要遵循两个准则。,114,结构冲突(续),同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同。 产生原因:不同的局部应用关心的是该实体的不同侧面。 解决方法:使该实体的属性取各分E-R
37、图中属性的并集,再适当设计属性的次序。,115,结构冲突(续),学生,学号,姓名,性别,平均成绩,(a)在局部应用A中,116,结构冲突(续),学生,学号,姓名,出生日期,年级,(b)在局部应用B中,所在系,117,结构冲突(续),学生,学号,姓名,政治面貌,(c)在局部应用C中,118,结构冲突(续),学生,政治 面貌,学号,出生 日期,年级,(d)合并后,所在系,平均 成绩,姓名,性别,119,结构冲突(续),实体之间的联系在不同局部视图中呈现不同的类型例1:实体E1与E2在局部应用A中是多对多联系,而在局部应用B中是一对多联系例2:在局部应用X中E1与E2发生联系,而在局部应用Y中E1、
38、E2、E3三者之间有联系。 解决方法:根据应用语义对实体联系的类型进行综合或调整。例P222,返回,120,二、修改与重构,基本任务 消除不必要的冗余,设计生成基本E-R图,121,修改与重构(续),1冗余 2消除冗余的方法,返回,122,1冗余,冗余的数据是指可由基本数据导出的数据,冗余的联系是指可由其他联系导出的联系。 冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难 并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高某些应用的效率,不得不以冗余信息作为代价。 消除不必要的冗余后的初步E-R图称为基本E-R图。,123,2消除冗余的方法,分析方法 以数据字典和数据流图
39、为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余。 例:教师工资单中包括该教师的基本工资、各种补贴、应扣除的房租水电费以及实发工资。由于实发工资可以由前面各项推算出来,因此可以去掉,在需要查询实发工资时根据基本工资、各种补贴、应扣除的房租水电费数据临时生成。,124,消除冗余的方法(续),如果是为了提高效率,人为地保留了一些冗余数据,则应把数据字典中数据关联的说明作为完整性约束条件。一种更好的方法是把冗余数据定义在视图中,125,消除冗余的方法(续),规范化理论 函数依赖的概念提供了消除冗余联系的形式化工具 方法 确定分E-R图实体之间的数据依赖FL 。实体之间一对一、一对多、多对
40、多的联系可以用实体码之间的函数依赖来表示。例:班级和学生之间一对多的联系:学号班级号学生和课程之间多对多的联系:(学号,课程号) 成绩,126,消除冗余的方法(续),2. 求FL的最小覆盖GL ,差集为D = FL-GL。逐一考察D中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。,127,最后:验证整体概念结构,视图集成后形成一个整体的数据库概念结构,对该整体概念结构还必须进行进一步验证,确保它能够满足下列条件: 整体概念结构内部必须具有一致性,不存在互相矛盾的表达 整体概念结构能准确地反映原来的每个视图结构,包括属性、实体及实体间的联系 整体概念结构能满足需要分析阶段所确定的所有要求,
41、128,验证整体概念结构(续),整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数据库的依据。,返回,129,概念结构设计小结,什么是概念结构设计,130,概念结构设计小结,概念结构设计的步骤 进行数据抽象,设计局部概念模式 集成局部视图,得到全局概念结构 验证整体概念结构,131,概念结构设计小结,数据抽象 分类 聚集 概括,132,概念结构设计小结,设计局部视图 选择局部应用 逐一设计分E-R图 标定局部应用中的实体、属性、码,实体间的联系 用E-R图描述出来,133,概念结构设计小结,集成局部视图 1.合并分E-R图,生成初步E-R图 消除冲突 属性冲突 命名冲突 结构冲突 2. 修改与重构 消除不必要的冗余,设计生成基本E-R图 分析方法 规范化理论,