收藏 分享(赏)

第1章_数据库基础知识.ppt

上传人:dzzj200808 文档编号:4299054 上传时间:2018-12-21 格式:PPT 页数:80 大小:2.42MB
下载 相关 举报
第1章_数据库基础知识.ppt_第1页
第1页 / 共80页
第1章_数据库基础知识.ppt_第2页
第2页 / 共80页
第1章_数据库基础知识.ppt_第3页
第3页 / 共80页
第1章_数据库基础知识.ppt_第4页
第4页 / 共80页
第1章_数据库基础知识.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

1、课程简介,课程简介,数据库基础知识及概念; Access数据库系统概述、表、查询、窗体、报表、宏的创建与使用等, 掌握Access2003基本使用方法及操作技能, 掌握数据库设计的方法, 结构化查询语言SQL 面向对象的程序设计方法初步 能结合应用系统的开发实例,用Access2003建立一个小型的数据库应用系统。,教材,数据库技术应用教程何宁主编 机械工业出版社参考书: 全国计算机等级考试二级Access ,等级考试研究专家组编著 中国铁道出版社 全国计算机等级考试上级考试习题集,考试命题组著, 南开大学。,考核方式: 平时成绩 综合作业 闭卷考试,第1章 数据库基础知识,1.1数据库系统的

2、基本概念 1.2数据模型 1.3关系数据库理论 1.4数据库应用系统设计,1.1 数据库系统的基本概念,数据库:能将大量的数据按照一定的方式组织并存储起来,能够快速方便的管理与维护数据的方法与技术,大大地方便了数据共享。 数据库是为了某个特定目标设计、建立和使用的,它拥有确定的用户组和这些用户组感兴趣的预定的应用。,信息和数据,信息是显示世界事物的存在方式或运动状态的反映。 数据是一种物理符号的序列,用于记录事物的情况,是对客观事物及其属性进行的描述。 数据可以是数字符号、文字符号、图像、声音等 信息是加工过的数据,是经过处理后对决策者有用的数据。 数据和信息的关联 数据是信息的载体,承载信息

3、的物理符号 信息是数据的内涵,是数据的语义解释,数据处理,数据处理,也称为信息处理,是把各种类型的数据进行收集、储存、分类、加工和传输的一系列活动的总和。 数据处理的目的不仅是从大量的、原始的数据中,通过分析、归纳、推理等科学方法,获得并提取有效的信息资源,为进一步分析、管理、决策提供依据。,数据处理技术的发展过程,计算机数据处理技术随着计算机软件和硬件技术的发展经历了四个阶段: 人工管理阶段 文件系统阶段 数据库系统阶段 分布式数据库系统、面向对象数据库系统,人工管理阶段,20世纪50年代中期以前 计算机速度比较慢,计算机上也没有专门的管理数据的软件,更没有诸如磁盘之类的设备来存储数据。 应

4、用程序和数据之间结合相当紧密,每次处理一批数据,都要特地为这批数据编制相应的应用程序,人工管理阶段,特点 数据不保存; 数据需要由应用程序自己管理,没有相应的软件系统负责数据的管理; 数据不共享; 数据不具有独立性,数据的逻辑结构或物理结构发生变化后,必须对应用程序作相应的修改。,文件管理阶段,20世纪50年代后期至20世纪60年代中期 专门管理数据的软件文件系统 数据可以存储,文件管理阶段,特点 数据可以长期保存; 由专门的软件即文件系统进行数据管理; 数据共享性差; 数据独立性低。,数据库系统阶段,20世纪60年代后期,文件系统管理方式,数据库系统阶段,特点 数据结构化; 数据的共享性好,

5、冗余度低; 数据独立性高; 由专门的数据管理软件即数据库管理系统对数据进行统一管理。,分布式数据库系统,70年代后期至今 分布式数据库系统阶段:与网络技术紧密结合 特点:合理分布数据在系统的相关节点上,实现节点共享,逻辑上属于同一系统,但在物理结构上是分布式,因此用户感觉不到数据的分布。 由若干个节点集合而成,在通讯网络中联接在一起,每个节点都是一个独立的数据库系统,都拥有各自的数据库,中央处理机、终端以及各自的局部数据库管理系统,面向对象数据库系统,面向对象数据库系统:是数据库技术与面向对象程序设计的结合 特点:他克服了传统数据库的局限性,能够自然的存储复制的数据对象及它们之间的复杂关系,大

6、幅提高了数据库管理效率、降低了用户使用的复杂性。,数据库系统,数据库系统是指一个具体的数据库管理系统软件和用它建立起来的数据库。 组成 硬件系统 相关软件(包括操作系统,编译系统等) 数据库 数据库管理系统 人员(包括数据库管理员,系统分析员,应用程序员和用户),数据库系统组成,1数据库(DB):存储在计算机存储设备上、大量的结构化的、可共享的相关数据的集合。 2数据库管理系统(DBMS):帮助用户建立、使用、管理和维护数据库的一种计算机系统软件。在数据库管理系统下,数据库能按一定的规则将相关的数据集中在一起,使用者可方便地存取所需的数据。 数据定义功能:数据描述语言DDL,用来描述数据库的结

7、构 数据操纵功能:数据操纵语言DML,供用户对数据库进行数据查询、统计、存储、维护、输出等操作 运行管理和控制功能:对数据库系统提供必要的控制和管理功能 3数据库系统(DBS):采用了数据库技术的完整的计算机系统。 4数据库管理员(DBA):对系统进行集中控制的人称作数据库管理员 作用:模式定义、存储结构及存取方式定义、数据访问授权、完整性约束定义等。,内容提要,1.1数据库系统的基本概念 1.2数据模型 1.3关系数据库理论 1.4数据库应用系统设计,1.2数据模型,三个世界计算机信息管理的对象是现实生活中的客观事物,但这些事物是无法直接输入计算机,必须进一步整理和归类,进行信息的规范化,然

8、后才能将规范信息数据化并输入计算机的数据库中保存起来 这一过程的转变需要-现实世界、信息世界和数据世界,1.2数据模型,三个世界 现实世界:存在与人脑之外的客观世界,包括事物及事物之间的联系。信息世界:是现实世界在人脑中的反映数据世界(机器世界):将信息世界中的实体数据化,事物及事物之间的联系用数据模型来描述。,1.2数据模型,三个世界的转换 现实世界信息世界数据世界,概念模型,结构模型,1.2数据模型,信息世界的基本概念 实体: 客观存在的、可区分的事、物。 属性:实体所具有的某一特性。一个实体可以有若干个属性来刻画。例如学生实体是由学号、姓名、性别、出生日期、专业等属性组成。 主码:唯一能

9、标识实体的属性集 实体型:实体名和属性名的集合。“学生”实体其型的描述为:学生(学号,姓名,性别,出生日期,专业) 实体值 :是实体的具体实例,是属性值的集合。 (200520403128,胡广飞, 男, 1986-4-6,04)。 实体集:性质相同的同类实体的集合。,信息世界基本概念,联系:反映实体内部和外部之间的联系。 实体内部的联系主要表现在实体内部个属性之间的联系,例如学号和入学时间有一定的联系 实体外部之间的联系可以分成三类:一对一联系、一对多联系、多对多联系 一对一联系 如果对于实体集A中的每一个实体,实体集B中至少有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系

10、。记为11。 例如:一个班只有一个正班长,而班长只在一个班任职,则班级与班长之间有一对一联系。,概念模型及其概念,一对多联系 如果对于实体集A中的每一个实体,实体集B中有n(n0)个实体与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系。记为1n。 例如:实体集学生和实体集选课之间具有一对多联系。 多对多联系 如果对于实体集A中的每一个实体,实体集B中有n(n0)个实体与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m(m0)个实体与之联系,则称实体集A与实体集B具有多对多联系。记为mn。 例如:实体集学生于实体集课程之

11、间具有多对多联系。 说明:一对一联系是一对多联系的特例,而一对多联系又是多对多联系的特例。,1.2数据模型,概念模型及其概念,概念模型:是按用户的观点对数据和信息建模,使用易于理解的概念、符号、表达方式来描述事物及其联系,它与任何计算机和数据库管理系统没有关联,容易被没有计算机知识的用户理解。易于向数据库管理系统支持的数据模型转换。最常见的是实体-联系模型(E-R模型)。,概念模型的表示方法,实体-联系方法:用E-R图来描述现实世界的概念模型。E-R图提供了表示实体型、属性和联系的方法。 实体型:用矩形表示,矩形框内写明实体名。 属性:用椭圆形表示,用实线将其与对应的实体联系起来。 联系:用菱

12、形表示,菱形框内写明联系名,并与实体链接,并写明联系的类型,概念模型及其概念,属性:实体所具有的某一特性。一个实体可以有若干个属性来刻画。例如学生实体是由学号、姓名、性别、出生日期、专业等属性组成(200520403128,胡广飞, 男, 1986-4-6,04)。 码:唯一标识实体的属性集。例如学生实体的学号,学生选课中的学号+课程号等。 域:属性的取值范围。例如学生学号的域为12位数字符号等。,概念模型的表示方法,联系:用菱形表示,菱形框内写明联系名,并用实线与有关实体连接起来,同时在旁标上联系的类型(11、1n、mn)。联系本身也是一种实体,也有自己的属性。,1.2 数据模型,1.2.1

13、 数据模型的组成要素 1.2.2 概念模型 1.2.3 常用的数据模型,层次模型,层次模型是数据库系统中最早出现的数据模型,最典型的代表是1968年IBM公司研制的商用数据库管理系统IMS,是世界上第一个DBMS产品。 层次模型用树型(层次)结构来表示各实体及实体间的联系。现实世界中许多实体之间的联系就呈现出一种自然的层次关系。以学校的组织机构为例,最上层为学校,其下层有若干学院、研究所等,每个学院的下层有若干系,系的下层有若干班级,如此形成了一个庞大的层次型数据库。,层次模型,特点: 有且仅有一个结点位于最高层,称为根结点。根结点只有子结点(下层结点),没有父结点(上层结点、双亲结点); 其

14、他结点有且仅有一个父结点(上层结点、双亲结点)。,层次模型,优点 结构本身比较简单,层次清晰,易于实现;向下寻找数据容易,与日常生活的数据类型相当。 缺点 只适合处理11和1N的关系,因而难以实现复杂数据关系的描述;寻找非直系的结点非常麻烦,必须先通过父结点由下而上,再由上往下寻找,搜寻的效率很低。,网状模型,最典型的网状模型是DBTG系统,也称为CODASYL系统。这是20世纪70年代数据库系统语言研究会CODASYL下属的数据库任务组提出的一个系统方案。 网状数据模型用有向图结构表示实体和实体之间的联系。 以学生的成绩管理系统为例,有很多学生和很多门课程,每一个学生可选修不同的课程,每一门

15、课程可被多个学生选修,这种学生和课程之间的关系就不能用树型的层次结构表示出来,可以用网状模型表示它们之间的这种多对多的联系。,网状模型,特点: 至少有一个结点有多于一个的父结点; 可以有一个以上的结点无父结点,即可以有多个根结点;,网状模型,优点 可以处理两个结点之间联系,因此可以更加普遍地去描述现实世界中的数据结构;子结点之间的关系较接近,具有良好的性能,存取效率较高。 缺点 其有向图的灵活性以数据结构的复杂化为代价,随着应用环境的扩大,编写应用程序比较复杂,当加入或删除数据时,牵动的相关数据很多,不易维护与重建。,关系模型,1970年,IBM公司San Jose研究实验室的研究员E.F.C

16、odd发表了题为大型共享数据库数据的关系模型论文,首次提出了“关系模型”的概念,开创了数据库关系方法和关系数据理论的研究,继而诞生了关系型数据库系统RDBS 关系模型是以关系数据理论为基础构造的数据模型,它建立在严格的数学集合论基础上,采用人们惯用的二维表格(若干行和若干列形式),来描述数据集合以及它们之间的联系。,学生信息,关系模型特点,关系模型的数据结构简单,无论是实体还是实体之间的联系都用关系表来表示。不同的关系表之间通过相同的数据项或关键字构成联系。正是这种表示方式可直接处理两实体间mn的联系。 关系模型中的所有的关系都必须是规范化的。 关系模型的数据操作是从原有的二维表得到新的二维表

17、 无论原始数据还是结果数据都是同一种数据结构二维表 数据操作是集合操作,即操作对象和结果是若干元组的集合,而不象层次和网状模型中是单记录的操作方式 关系模型把存取路径向户隐蔽起来,用户只需要指出要做什么, 而不必详细地指出如何做,大大提高了数据的独立性和系统效率。,面向对象模型,面对大型工程复杂数据的管理,单纯依靠传统的数据库系统难以胜任。把面向对象技术与数据库技术结合成为了数据库技术的新方向。20世纪80年代中后期以来,面向对象数据库管理系统(OODBMS)和对象-关系型数据库管理系统(ORDBMS)的研究十分活跃。,内容提要,1.1数据库系统的基本概念 1.2数据模型 1.3关系数据库理论

18、 1.4数据库应用系统设计,1.3 关系数据库概述,1.3.1 关系的特点和类型 1.3.2 关系的完整性规则 1.3.3 关系代数,基本概念,关系(Relation):建立在集合论的基础之上的,是笛卡儿积的子集。一个关系就是一张二维表,每个关系有一个关系名。 对关系的结构描述称为关系模式。其格式为 关系名(属性名1,属性名2,属性名n) 在数据库中,关系模式对应着二维表的表结构 表名(字段名1,字段名2,字段名n) 元组(Tuple):关系中水平方向的行称为元组。 在数据表中,一个元组对应一条记录。如学生表中的一行对应一条学生记录。一个关系就是若干个元组的集合。 属性(Attribute):

19、关系中垂直方向的列称为属性。 每一列有一个属性名。在数据表中,一个属性对应着一个字段,属性名即字段名,每个字段对应的数据类型和宽度在定义表的结构时规定。如学生表中的学号、姓名、性别等字段及其相应的数据类型组成了学生表的表结构。 域(Domain):属性的取值范围。 如学生表中的姓名字段的取值范围是文字字符,性别字段的取值范围是汉字“男”或“女”,逻辑型字段团员否只能从“真”和“假”两个值中取值。,基本概念,元:关系模式中属性的数目称为关系的元数,又称为关系的目、度 如学生表是十元关系。只有一个属性的关系称为一元关系,只有两个属性的关系称为二元关系。 关键字(Key):是关系模型中的一个重要概念

20、,它表示为关系的一个属性或属性集。 主关键字(Primary Key):表中的某个属性或某些属性的集合,它们可以唯一确定一个元组。 例如,学生表中的学号字段可以惟一地标识一条学生记录,该字段是学生表的主关键字 外部关键字(Foreign Key):当一张二维表的主关键字被包含到另一张二维表中时,主关键字就称为是另一张二维表的外部关键字。 例如: 学生(学号,姓名,性别,出生日期,专业编号,) 课程(课程编号,课程名称,学分,课时,) 学生选课(学号,课程编号,成绩) 其中,对于学生选课表而言,学号或课程编号都是外部关键字。 通过外部关键字,可以实现关系之间的动态联接,,关系的特点,元组个数的有

21、限性 元组的唯一性 元组次序无关性 属性必须是不可分割的 属性名的唯一性 属性的值的同质性 属性次序无关性,关系的类型,基本表:是关系数据库中独立存在的表,是实际存储数据的逻辑表示。 视图表:是从基本表或其他视图中导出的表,它是数据库的一部分。 视图表是为了方便数据查询和处理而设计的数据虚表,它不对应实际存储的数据,在数据库中只存储有视图的定义,而没有存储对应的数据。 视图表依附于基本表,可以利用视图表进行数据查询,或利用视图表对基本表进行数据维护,但视图本身不需要进行数据维护。 查询表:是根据指定条件对基本表进行查询所得的结果表。由于关系运算是集合运算,在关系操作过程中会产生一些临时表,称为

22、查询表。,1.3 关系数据库概述,1.3.1 关系的特点和类型 1.3.2 关系的完整性规则 1.3.3 关系代数,实体完整性,实体完整性规则规定基本关系中的主关键字不能取空值或重复值 关系模型必须满足实体完整性规则 关系中主关键字的作用是惟一标识一个元组 若一个关系的主关键字值为空或者出现重复值,则说明存在某个不可标识或不可区分的实体,这和实体独立性相矛盾。 例 在学生表中,主关键字为学号字段,那么“学号”字段的取值不能为空或取重复值,否则就不能惟一标识一条学生记录。学生表中的其他属性可以是空值,如“出生日期”字段或“性别”字段如果为空,则表明不清楚该学生的这些特征值。 在学生选课成绩表中,

23、主关键字为字段组合(学号,课程编号),那么“学号”和“课程编号”两个字段都不能取空值。,参照完整性,参照完整性规则通过定义外部关键字和主关键字之间的引用规则来约定两个关系之间的联系。 如果属性(集)S是关系R1的主关键字,同时是关系R2的外部关键字,那么在关系R2中,S的值必须满足下面两种情况之一。 为空值; 等于关系R1中某个元组的主关键字的取值。 例 学生(学号,姓名,性别,出生日期,专业编号,) 专业(专业编号,专业名称) 其中,专业编号字段是专业表的主关键字,是学生表的外部关键字。显然,学生表中专业编号字段的取值必须是确实存在的专业编号,即在专业表中有该专业的记录。那么,在学生表中,专

24、业编号字段的值要么为空,表示学生暂时还没有确定专业;要么为专业表中的某个记录的主关键字值(学生已经确定了专业,且该专业存在),而不可能取其他的值。,用户定义的完整性,不同的关系数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件,用户定义的完整性就是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。 例如,学生的考试成绩必须在 0100 之间,学生的学号必须是12位,一个学生在图书馆的借书不能超过10本,在职职工的年龄不能大于60岁等,都是针对具体关系提出的完整性条件。,1.3 关系数据库概述,1.3.1 关系的特点和类型 1.3.2 关系的完整性规则

25、 1.3.3 关系代数,关系代数,传统的集合运算 并、交、差、笛卡儿积等 专门的关系运算 选择、投影、联接、自然联接等运算。关系运算的运算对象和运算结果都是关系。,并(Union),设关系R和关系S具有相同的元数n(即两个关系都有n个属性),且相应的属性的取值来自同一个域。 关系R与S的并运算记为RS,它是由属于R或者属于S的元组组成的集合。 运算结果仍为n元关系。 RS = t | tR tS 。,并(Union),关系R1,关系R2,R1R2,交(Intersection),设关系R和关系S具有相同的元数n(即两个关系都有n个属性),且相应的属性的取值来自同一个域。 关系R与S的交运算记为

26、RS,它是由既属于R又属于S的元组组成的集合。 运算结果仍为n元关系。 RS = t | tR tS 。,交(Intersection),关系R1,关系R2,R1R2,差(Difference),设关系R和关系S具有相同的元数n(即两个关系都有n个属性),且相应的属性的取值来自同一个域。 关系R与S的差运算记为RS,它是由属于R而不属于S的所有元组组成的集合。 运算结果也为n元关系。 RS = t | tR tS,差(Difference),关系R1,关系R2,R1R2,笛卡儿积(Cartesian Product),两个分别为r目和s目的关系R和S的广义笛卡尔积记为RS,它是一个(r+s)目

27、的关系。关系中每个元组的前r个分量(属性值)来自R的一个元组,后s个分量来自S的一个元组。 RS = 如果R有i个元组,S有j个元组,则RS有(ij)个元组。,关系R1,关系R3,R1R3,笛卡儿积(Cartesian Product),选择(Select),从一个关系中查找满足指定条件或指定范围的所有元组的操作称为选择。满足条件(逻辑表达式的值为真)的元组被选取。 选择运算是从行的角度进行的操作,即水平方向抽取元组。经过选择运算得到的结果元组形成新的关系,其关系模式不变,但其中元组的数目小于或等于原来的关系中元组的个数,它是原关系的一个子集。 F( R ) = t | tR F( t ) =

28、 真 其中F表示选择条件。,选择(Select),在关系R1中,查询入学成绩高于600分的学生记录。 入学成绩600 ( R1 ),关系R1,入学成绩600 ( R1 ),投影(Project),从关系中挑选指定的属性组成新的关系称为投影。 投影是从列的角度进行的运算,即对关系进行垂直分解。经过投影得到的新关系所包含的属性个数往往比原关系少(元数减小)。另外,如果新关系中出现重复元组,则要删除重复元组。 A( R) = tA | tR 其中A为R中的属性列表。,投影(Project),查询关系R1中所有学生的学号、姓名信息。 学号, 姓名( R1),关系R1,学号, 姓名( R1),联接(Jo

29、in),按照一定的联接条件将两个关系横向结合在一起,生成一个更宽的新关系的操作称为联接。联接条件通常为一个逻辑表达式,即通过比较两个关系中指定属性的值来联接满足条件的元组。,联接(Join),查询R1中每个学生的学号、姓名和必修课成绩。,关系R1,关系R4,联接R1和R4,内容提要,1.1数据库系统的基本概念 1.2数据模型 1.3关系数据库理论 1.4数据库应用系统设计,1.4 数据库应用系统设计,1.4.1 需求分析 1.4.2 系统设计 1.4.3 系统编程 1.4.4 软件测试 1.4.5 应用程序发布 1.4.6 系统运行和维护,1.4 数据库应用系统设计,1.4.1需求分析需求分析

30、做的是否充分和准确,决定了开发系统的进程,决定了数据库和应用系统的质量。 明确用户需求,确定系统功能,系统性能(安全性、可靠性、可维护性等),1.4 数据库应用系统设计,1.4.2 系统设计 概念设计(形成概念模型、将概念模型转换成数据模型、分析数据,确定数据库,记表结构) 数据库设计 (定义数据字典、表关系、参照完整性等),1.4 数据库应用系统设计,1.4.3 系统编程 1.4.4 软件测试 模块测试综合测试,1.4 数据库应用系统设计,1.4.5 应用程序发布 制定故障恢复规范制定系统的安全规范 1.4.6 系统运行和维护 维护数据库的安全性和完整性故障恢复数据备份系统性能监察,END,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 网络科技 > 数据库

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报