1、研究生系列课程 研究生系列课程 数据结构与数据库 数据结构与数据库 Data Structure and Database Data Structure and Database 主 主 讲:胥 讲:胥 军 军 武汉理工大学 武汉理工大学 机电工程学院 机电工程学院 数据结构与数据库 数据结构与数据库 Data Structure and Database Data Structure and Database 主 主 讲:胥 讲:胥 军 军 武汉理工大学 武汉理工大学 机电工程学院 机电工程学院研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.1 基本概念与定义 数据(
2、Data ) 是载荷信息的媒体,它包括结构化数据 和非结构化数据。 信息 是一个抽象的概念,反映的是客观世界的知识, 是通过加工后形成的特定形式的数据 信息是通过处理数据产生的,数据是信息的载体,是 信息的具体形式。 数据只有处在特定背景下才是有意义的。为数据提供 特定背景的主要机制是元数据。元数据是描述终端用户数 据的属性(或特征)和该数据环境的数据。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.1 基本概念与定义 数据库系统(DataBase System ,DBS )是指一个计 算机存储记录信息的系统。从管理层观点来看,数据库系 统有4 个主要部件构成:硬件、软
3、件、人员和数据。 硬件 指系统所有的物理设备。数据库系统的硬件组件主要 有:计算机、存储设备、网络等。 软件 指系统内所有程序的集合。数据库系统的软件主要 有:操作系统、DBMS (DataBase Management System ,DBMS ) 、数据库系统开发工具等。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.1 基本概念与定义 人员 指数据库系统的所有用户。一般把数据库系统中的用户 分为4 类:数据库管理员、系统分析员和数据库设计人员、 应用程序开发人员,以及终端用户。 数据库管理员 (DataBase Administrator, DBA )的主要职责
4、是负责数据库的规划、设计、维护和监控。DBA需要对各个应用 的数据需求做全面的规划、设计和集成,负责对数据库中数据的 安全性、完整性以及系统恢复进行实施与维护,并且不断地调整 数据库内部结构,保持系统的最佳状态与最高效率。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.1 基本概念与定义 系统分析员的主要任务是编写应用系统的需求分析、确 定数据库系统的软硬件配置,并参与数据库的设计和程序 开发工作。 数据库设计人员主要负责设计数据库的结构,是数据库 的建筑师。 应用程序开发人员的任务是编写应用系统的程序模块, 并负责调试和安装。 终端用户是使用应用程序的人员,包括日常业
5、务操作人 员和高级用户。其中高级用户可以运用数据库获取的信息 作出战略和战术上决策。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.1 基本概念与定义 数据 指存储在数据库中的事实集合。数据是产生信息的关键 原料,好的数据才有可能产生更好的信息,它是一个数据 库系统的“质量”基础。 数据库设计者的重要工作就是确定在数据库中存储那 些数据,以及如何组织这些数据。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 文件系统 20世纪50年代后期至60年代中期,已经有了磁盘、磁鼓 等直接存取存储设备,操作系统中也已经有了专门的数据 管
6、理软件,一般称为文件系统。在文件系统中,把数据按 其内容、结构和用途组织成若干个相互独立的文件。 文件系统管理数据具有如下特点: 文件系统利用“按文件名访问,按记录进行存取”的管 理技术对数据进行管理。 数据可以长期保存在存储设备上供用户使用。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 第一代数据库系统 20世纪70 年代,数据库系统以广为流行的网状模型数据 库和层次模型数据库为代表。第一代数据库系统发展过程中 的突出代表有: 1964年,美国通用电气公司的Bachman 等人开发成功世 界上第一个DBMSIDS (Integrated Dat
7、a Store )系统,奠 定了网状数据库系统的基础。 1969年,美国IBM 公司研制成功世界上第一个商品化 DBMS产品IMS (Information Management System )系 统,这是一个层次数据库系统。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 19691970 年,美国CODASYI (Conference On Data System Language) 协商会下属的DBTG (DataBase Task Group) 对数据库方法进行了系统的研讨,提出了DBTG 报 告,建立了以网状数据库模型为基础的数据库系统概
8、念。 第一代数据库系统的主要特点是支持三级抽象模型的体 系结构;用存取路径(指针)来表示数据间的联系;数据 定义语言(DDL )和数据操作语言(DML )相对独立,数 据库语言采用过程性(导航式)语言。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 第二代数据库系统 20世纪70 年代初关系数据模型的提出受到了人们的高度 重视。在这些关系数据库原型中,功能最强、技术上最有 代表性的是1976 年IBM 公司宣布的System R (19741979) 和 美国加州大学Berkeley 分校的Ingres 关系数据库系统。 与此同时,1979 年美国
9、ORACLE 公司推出了用于VAX 小型机上的关系数据库软件Oracle(v2.0) ,这被认为是第一 次实现了使用SQL 语言的商品化关系数据库软件。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 通常把支持关系数据模型的关系数据库系统称之为第二 代数据库系统。关系模型建立在严格的数学理论基础之上, 它概念简单、清晰,易于用户理解和使用。因而在这一时期 得到迅猛发展,几乎所有新推出的数据库系统都是关系型数 据库系统。 20世纪80年代是数据库技术逐渐走向成熟的时期,一批 性能不断改善,版本不断更新的商品化关系数据库软件相继 投入市场,如Oracl
10、e ,Sybase ,Informix ,Ingres 等关系数 据库系统开始广泛应用于大型信息管理系统。 目前流行的数据库产品主要是关系型数据库。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 新一代数据库系统 随着计算机的广泛应用,特别是一些新的应用领域不断 提出新的应用要求,关系型数据库、层次型数据库、网状 型数据库都表现出不同程度的局限性。如CAD/CAM 、 CIM 、OIS (办公信息系统)、GIS (地理信息系统)、知 识库系统、实时系统等,都需要数据库的支持,而其所需 的数据管理功能有相当一部分是传统的数据库系统所不能 支持的。研究
11、生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 因此,在20 世纪80年代后期人们又提出了研制新一代 数据库的设想。可以说新一代数据库技术的研究和发展呈 现了百花齐放的局面。 归纳起来其主要特征有: 一是面向对象的方法和技术与数据库技术的结合; 二是数据库技术与多学科技术的有机结合; 三是面向应用领域的数据库技术的研究。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.2 数据库发展的历史 中国数据库市场 根据易观国际发布的数据显示,2006 年中国商业数据库 市场的前四甲依次是:Oracle 、IBM 、Microsoft 和S
12、ybase 。 Oracle 以39% 的占有率再排第一,IBM 占据了26% 的市 场份额,微软和Sybase 分别占有17.8 和13.3,这四者已经占 据了96% 的市场份额。 国产数据库占有少量市场份额,主要应用领域是具有国 防和保密性质的部委、航空航天工业以及各地方政府,其中 武汉达梦占有0.7% ,神州航天占有0.5% ,人大金仓占有 1.0%。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 数据库系统是指 引入了数据库技术后 的计算机系统。广义 地讲,数据库系统由 数据库、DBMS(数 据库管理系统)、 DBA (数据库管理 员)、应用程序以及 用户组成。 1
13、.3 数据库系统研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.3 数据库系统 数据库方法的概念可用下图表示: 数据 DBMS 应用 请求 回答 特点:功能预定、被动 (用户界面)研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 某销售公司的3个文件处理系统包括订单填写系统、开 发票系统、工资单系统。图中还显示了与每个应用相关联的 主要数据文件(一个文件就是一个相关记录的集合)。 1.3 数据库系统研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 对于前面图示的某销售公司的3个文件处理系统,如果 采用数据库方法,其概念可用下图表示。
14、销 售部门 会计部门 人事部门 . 数据库应用 DBMS 元数据 顾客 雇员 产品 订单 . 1.3 数据库系统研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.3 数据库系统 与传统的文件系统相比,数据库系统呈现出许多潜在 的优点。其主要表现在如下几个方面: 程序数据独立性 提高了数据的共享性 降低了数据的冗余度,提高了数据的一致性 采用一定的数据模型实现数据结构化 数据由DBMS统一管理和控制研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.3 数据库系统 DBMS 是数据库系统软件的核心,它是用户的应用程序 和物理数据库之间的桥梁。用户对数据的
15、一切操作都是在 DBMS 的指挥、调度、控制下进行的,而且只能借于DBMS 实现。DBMS 同时要保证数据的安全性、可靠性、完整性和 一致性。其主要功能包括: 数据字典管理、数据存储管理、数据转换和表示、安 全性管理、多用户访问控制、备份和恢复管理、数据完整 性管理、数据访问语言和应用程序编程接口、数据库通信 接口等。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 在实际应用当中, 数据库系统的种类很 多,它们可以支持不同 的数据模型,建立在不 同的操作系统之上,数 据的存储格式也不相 同,但它们在体系结构 上具有相同的特征,即 采用三级模式结构。 . . . 1.3 数据
16、库系统研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 模型 (Model) 是对是复杂的现实事物或事件的抽象。 数据模型(Data Model) 是对现实世界中数据特征的抽 象,它是复杂的现实数据结构的相对简单的表示法,通常用 图形方式给出。模型的主要作用是帮助我们理解现实环境的 复杂性。 在数据库环境中,数据模型表示数据结构以及它的特 性、关系、约束和转换。数据库设计者把数据模型用作促进 设计者、程序员和终端用户之间进行交流的通信工具。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 由于计算机不能直接处理现实世界中的具体事物,所 以人
17、们必须首先把现实世界中的具体事物进行抽象(通常 被称为概念模型设计),然后再组织为某一DBMS支持的数 据模型(如关系模型)。 1.4 数据模型研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 一个好的数据模型应满足三方面的要求: 一是能比较真实地模拟现实;二是容易为人所理解; 三是便于在计算机上实现。 一般而言,数据模型由数据结构、数据操作和数据的 约束条件三部分组成。 数据结构 。数据库规定了如何把基本的数据项组织成 较大的数据单位,以描述数据的类型、内容、性质和数据 之间的相互关系。它是数据模型最基本的组成部分。研究生系列课程 数据结构与数据库 研究生
18、系列课程 数据结构与数据库 1.4 数据模型 数据操作。数据操作是指一组用于指定数据结构的任何 有效的操作或推导规则。数据库中主要的操作有查询和更 新(插入、删除、修改)2大类。数据模型要给出这些操作确 切的含义、操作规则和实现操作的语言。 数据约束条件。数据的约束条件是一组完整性规则的集 合,它定义了给定数据模型中数据及其联系所具有的制约 和依存规则,用以限定相容的数据库状态的集合和可容许 的状态改变,以保证数据库中数据的正确性、有效性和相 容性。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 主要的数据模型 层次模型(Hierarchical Mode
19、l ) 网状模型(Network Model ) 关系模型(Relational Model ) 实体关系模型(Entity Relationship Model ) 面向对象模型(Object Oriented Model )研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 层次模型的结构 层次模型是按照层次结构的形式组织数据库中的数据 的,即用树(Tree )型结构表示实体以及实体之间的联系。 每个结点表示一个记录类型,结点之间的连线表示记录类型 之间的联系。每个记录类型可以包括若干个字段(记录类型 描述的是实体,字段描述的是实体的属性)。研究生系列课程
20、 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 层次模型的特点 查询任何一个给定记录时,只有按其路径查看才能显示 出它的全部含义,没有一个子记录可以脱离双亲记录而存 在; 每个子结点只有一个双亲结点,而且只有一个结点没有 双亲结点,称为根结点; 层次数据库系统只能处理一对多的实体关系。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 层次模型的数据操纵与完整性约束 层次模型的数据操纵主要有查询、插入、删除和修改。 进行插入、删除、修改操作时要满足层次模型的完整性 约束条件。层次结构规定除根结点外,任何其它结点不能离 开其双亲结点而孤立
21、存在。进行插入操作时,如果没有相应 的双亲结点值就不能插入它的子结点值。在删除一个记录 时,其子记录也将被自动地删除。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 层次模型的优点 结构简单,便于理解和实现; 层次模型DBMS对层次结构的数据有较高的处理效率; 由于是双亲-子女关系,在双亲结点和子结点之间始终 存在着链接。由于子结点总是自动地引用其双亲,所以层次 模型提升了数据库的完整性。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 网状模型的结构 网状模型是一种比层次模型更具有普遍性的模型,即 用图(Graph )
22、型结构表示实体以及实体之间的联系。它 允许多个结点没有双亲结点,允许结点有多个双亲结点, 还允许两个结点之间有多种联系(称为复合联系)。 网状模型可以反映实体间存在的更为复杂的联系,而 层次结构可视为网状结构的一个特例。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 网状模型特点 能够更为直接地描述现实世界; 具有良好的性能和较高的存取效率。 数据结构比较复杂,不便于终端用户掌握; 其数据定义语言(DDL)、数据操作语言(DML)较为复杂, 用户掌握使用较为困难; 数据独立性较差。因为应用程序存取数据库的数据时必 须选择适当的存取路径,这不但加重了编程人员
23、的负担,而 且也影响到数据独立性。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 关系模型的结构 关系模型是用二维表描述实体以及实体之间的联系。在 关系模型中把二维表称为关系,表中的列称为属性,列中的 值取自相应的域(Domain) ,域是属性所有可能取值的集合。 表中的一行称为一个元组(Tuple) ,元组用关键字(Keyword) 标识。 无沦是对现实世界实体的描述,还是对实体之间联系的 描述,关系模型都采用统一的数据结构 二维表。这种数 据表示的一致性给关系数据库的数据定义和数据操纵带来了 极大方便。研究生系列课程 数据结构与数据库 研究生系列课程
24、数据结构与数据库 1.4 数据模型 关系模型的优点 关系模型具有坚实的理论基础。在层次、网状和关系三 种常用的数据模型中,关系模型是唯一可数学化的数据模 型。关系的数学基础是关系理论,对二维表进行的数据操作 相当于在关系理论中对关系进行运算。因此,在关系模型中 数据模型的定义与操作均建立在严格的数学理论基础上,这 为关系模型的研究提供有力的支持。 二维表不仅能表示实体,而且能方便地表示实体之间的 联系,所以说它有很强的表达能力,这是层次模型和网状模 型所不及的。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 简单。关系模型的基本结构是二维表,数据的表示方法
25、 统一、简单,便于在计算机上实现。另外,它向终端用户提 供的是简单的关系模型。用户通过这种模型表达用户的请 求,而不涉及系统内的各种复杂联系。 数据独立性高。关系模型中去掉了用户接口中有关存储 结构和存取方法的描述,即关系数据模型的存取路径对用户 透明,数据库中数据的存取方法具有按内容定址的性质,故 有较高的数据独立性。这为关系数据库的建立、扩充、调整 和重构提供了方便。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 用ER数据模型描述现实世界,不必考虑信息的存储结 构、存取路径以及存取效率。该模型是面向现实世界,而 不是面向机器的实现。它与传统数据模型相
26、比更便于直接 描述现实世界,且具有直观、自然、语义丰富、易于向关 系数据模型转换等优点。因此,ER数据模型在数据库的设 计中得到了广泛使用。 ER模型基于实体、联系和属性三个组件。从它的观点 来看,世界是由一组称作实体的基本对象和这些对象之间 的联系构成的。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 实体(Entity) 客观存在并可相互区分的事物叫实体。 如学生张三、工人李四、计算机系、葡萄酒等。 属性(Attribute) 实体所具有的某一特性。一个实体可以由若干个属性来 刻画。例如,学生可由学号、姓名、年龄、系、年级等组 成。 属性的取值范围为域
27、。例如,性别的域为(男、女),月 份的域为1 到12 的整数。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 联系(Relationship) 实体之间的相互关联 如学生与老师间的授课关系,学生与学生间有班长关系。 联系也可以有属性,如学生与课程之间有选课联系,每个 选课联系都有一个成绩作为其属性。 同类联系的集合称为联系集。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 例:描述学生与选修课程之间关系的ERD 学生 课程 选修 学号 姓名 系别 课程名 学分 主讲老师 用矩形表示实体集, 在框内写上实体名 用椭圆表示
28、实 体的属性 用无向边 把实体与 其属性连 接起来 用菱形表示实体 间的联系 将参与联系的实体 用线段连接 成绩研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 例:描述维修人员与被维护设备之间关系的ERD 维修人员 设备 维护 工号 姓名 技术级别 编号 名称 制造厂商 投入使用日期 维护号 检修原因 日期 结果研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 面向对象数据模型 面向对象数据模型(Object-Oriented Data Model) 是面 向对象程序设计方法与数据库技术相结合的产物,用以支 持非传统应用
29、领域对数据模型提出的新需求。 它的基本目标是以更接近人类思维的方式描述客观世界 的事物及其联系,且使描述问题的问题空间和解决问题的 方法空间在结构上尽可能一致,以便对客观实体进行结构 模拟和行为模拟。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 在OO 模型中,基本结构是对象而不是记录,一切事 物、概念都可以看作对象。一个对象不仅包括描述它的数 据,而且还包括对它进行操作方法的定义。另外,OO 模型 是一种可扩充的数据模型,用户根据应用需要定义新的数 据类型及相应的约束和操作,而且比传统数据模型有更丰 富的语义。 因此,OO 模型自20 世纪80 年代初提出后,受到人们的 广泛关注。研究生系列课程 数据结构与数据库 研究生系列课程 数据结构与数据库 1.4 数据模型 早期的OO 模型缺乏统一标准,推出的基于OO 模型的 面向对象数据库系统,其实现方法和功能也各有不同。这 使面向对象模型的应用受到一定的限制。 1989 年1月美国ANSI 所属的ASC X3 SPARC DBSSG( 数据库系统研究组) ,成立了面向对象数据库任务组 (OODBTG) ,开展了有关面向对象数据库(OODB) 标准化调 查研究工作,定义了用于对象数据管理的参照数据模型。 1991年8 月完成了OODBTG 的最终报告,它对OODBMS 的 发展有重要影响。