1、第一章 数据库基础知识,本章学习任务,1.1 数据库基础知识 1.2 关系数据模型 1.3 数据库设计基础,1.1 数据库基本概念,数据库:能将大量的数据按照一定的方式组织并存储起来,能够快速方便的管理与维护数据的方法与技术,大大地方便了数据共享。,111 数据库概述,1数据与数据处理 数据处理并不是计算机特有的概念,计算机没有引进我们的工作中时,财务部门所处理的单据、报表等属于数据处理。 计算机中的数据是存储在某一种媒介上能够识别的物理符号。 有两个含义: 描写事物的特性:例某人生日是“1980年12月21日” 数据在计算机中的表示形式:同一种意义的数据可能用多种不同形式表示,例: 生日是“
2、1980年12月21日”,也可以“1980.12.21”明天天气是“阴有雨”,也可以用图形符号: 用数据符号表示信息通常有三种: 数值型:如年龄、体重、价格、温度 字符型:姓名、单位、地址 特殊型:照片(图像)、刮风、下雨(图形符号),还有声音、视频(多媒体数据),数据处理,也称信息处理,是利用计算机对各种类型的数据进行处理。包括数据的采集、整理、存储、分类、排序、检索、维护、加工、统计和传输等一系列操作过程。 数据处理的目的是从大量数据中,通过分析、归纳、推理等科学方法,利用计算机技术、数据库技术等技术手段,提取有效的信息资源,为进一步分析、管理、决策提供依据。,2数据库(DataBase,
3、DB),孤立的数据不能代表确切的信息,为反映某一方面的信息往往需要若干数据。 例学生基本信息:姓名、性别、出生年月、籍贯、专业这些数据需组织起来。 最初的数据以文件形式组织,处理数据时,更多的是涉及对文件的操作(读、写),带来了数据处理不便、数据共享困难等一系列问题。数据库技术的产生有效地克服了这类问题。 数据库是存储在计算机系统中的存储介质上,按一定的方式组织起来的相关数据的集合。数据库是结构化的,不仅仅描述数据本身,而且数据之间的关系进行描述。 数据库中的数据具有高度的共享性。数据不是面向某一种应用,而是面向多种应用,可以被多个应用程序共享。,3数据库管理系统 (DataBase Mana
4、gement System,DBMS),DBMS是数据管理软件,它需要操作系统的支持,向用户提供了一系列的数据管理功能。 组成:数据定义语言、数据操纵语言、数据库运行控制程序、实用程序 功能:数据定义、数据操纵、数据库运行管理、数据组织、存储与管理、数据库的建立与维护、数据通信接口。,4数据库系统(DataBase System,DBS),是运行数据库系统的计算机系统。包括: 计算机硬件环境和操作系统环境 DBMS 数据库 数据库应用系统 用户,1.1.2 数据管理的发展历史,数据管理: 是数据处理的中心问题,指如何对数据 分类、组织、编码、存储、检索和维护。 数据管理的发展历史可以分为四个阶
5、段,第一阶段:人工管理阶段,(50年代中期以前): 人工管理阶段特点:数据与程序不具有独立性,一组数据对应一组程序。程序与程序之间存在大量数据冗余。,第二阶段:文件系统阶段,(50年代后期至60年代中期): 特点:程序和数据分开存储,形成程序文件和数据文件,程序可以按名访问数据文件。但是, 同一个数据项可能重复出现在多个文件中,导致数据冗余度较大,浪费空间,没有形成数据共享,又不易统一修改容易造成数据的不一致。,第三阶段:数据库系统阶段,(60年代后期至今)特点:为了解决多用户、多应用共享数据的要求,由数据库管理系统DBMS管理数据,提高数据共享,减少数据冗余,提供数据与应用程序独立, 达到有
6、效的管理和存取大量的数据资源。,第四阶段: 分布式数据库系统与面向对象数据库系统,(70年代后期至今) 分布式数据库系统阶段:与网络技术紧密结合 特点:合理分布数据在系统的相关节点上,实现节点共享,逻辑上属于同一系统,但在物理结构上是分布式,因此用户不感觉到数据的分布。 由若干个节点集合而成,在通讯网络中联接在一起,每个节点都是一个独立的数据库系统,都拥有各自的数据库、中央处理机、终端以及各自的局部数据库管理系统。,第四阶段: 分布式数据库系统与面向对象数据库系统,面向对象数据库系统:是数据库技术与面向对象程序设计技术结合 优点:它克服了传统数据库的局限性,能够自然地存储复杂的数据对象及它们之
7、间的复杂关系,大幅提高了数据库管理效率、降低了用户使用的复杂性。 书中银行系统为对象关系数据库系统,1.1.3 数据模型,1. 三个世界 计算机信息管理的对象是现实生活中的客观事物,但这些事物是无法直接送入计算机的,必须进一步整理和归类,进行信息的规范化,然后才能将规范信息数据化并送入计算机的数据库中保存起来。 这一过程经历了三个领域现实世界、信息世界和数据世界。,(1) 现实世界:存在于人脑之外的客观世界,包括事物及事物之间的联系。 (2) 信息世界:是现实世界在人们头脑中的反映。(3) 数据世界:将信息世界中的实体进行数据化,事物及事物之间的联系用数据模型来描述。 术语的对照,例子:学生借
8、阅图书,现实世界中:学生借阅图书 在信息世界中将抽象为学生和书籍两个实体集,两个实体集间的联系为“借阅”。 用关系模型表示为学生、书籍和借阅三个关系。 用ACCESS中建立学生、书籍和借阅三个数据表,并为学生和借阅两个表建立联系,为书籍和借阅两个表建立联系。这样,就完成了从现实世界到数据世界的转换。,2.数据模型,数据库的数据结构形式,叫数据模型,它是对数据库如何组织的一种模型化表示。 如果这个模型只能表示存储什么信息,那么它是简单的,是文件系统早已解决了的问题,更重要的是要以一定数据结构方式表示各种信息的联系。 数据模型表示的是数据库框架。打个比方,建设一幢楼房,首先要有建筑结构图,根据这个
9、结构图先搭好架子,然后才能堆砖砌瓦,使建筑物符合要求,数据模型就相当于这个建筑结构图,根据这个结构图组织装填数据。,数据模型的形式,概念模型(抽象的) 概念模型是数据库设计人员在认识现实世界中实体与实体间联系后进行的一种抽象。 实现模型(具体的) 有三种:层次型、网络型和关系型,概念模型,最常用的描述概念模型的方法,称为实体联系方法(Entity-Relationship Approach),简称E-R方法。 实体:指客观存在并可相互区别的物体。实体可以是实在的物体,如学生、图书等,也可以是抽象的事件,如订货、借书等。 属性:实体具有的某一种特性。如学生实体具有的姓名、性别等属性。 实体集:性
10、质相同的同类实体的集合称为。如一个班的学生、图书馆的所有图书、皇马球队的所有场比赛等。 实体型:属性的集合,例学生实体型描述为:学生(学号、姓名、性别、出生年月),实体之间的联系,一对一:工厂厂长 一对多:系教师 多对多:商店顾客,例教师讲课ER图,2 概念模型(实现模型),目前有三种常用的实现模型形式:层次型-IMS网状型-DBTG关系型-Access、vfp、oracle、DB2、sybase等。,(1)层次模型,l 有且仅有一个结点无双亲,称之为“根”。 l 除根结点外,其他子结点,有且仅有一个双亲。 l 各实体型由上向下是一对多关系,网络模型,能够表示实体间的多种复杂联系和实体类型之间
11、的对对多的联系。网络模型的特点: l 可以有一个以上的结点无父结点; l 至少有一个子结点有一个以上的父结点; 在两个结点之间有两个或两个以上的联系。,(3)关系型数据模型用二维表结构来表示实体以及实体之间联系的模型称为关系数据模型。无论实体本身还是实体间的联系均用称为“关系”的二维表来表示。能自然地反映实体间的联系。与前两者区别:数据描述的一致性,模型概念单一。,属性,属性值,出生日期,04/05/87,元组,关系模型举例,教师关系,1.2关系数据库,1.2.1、关系术语 关系:一个关系就是一张二维表,每个关系有一个关系名。如:纳税登记(税号,姓名,联系电话) 。 元组:一个二维表中,水平方
12、向的一行成为一个元组元组对应表中的一个具体记录。Access中表示为记录。 属性:二维表中垂直方向的列。Access中表示为字段名。,域:属性的取值范围。 关键字:其值能唯一地标识一个元组的属性或属性的组合。 如:教师关系中的“学号”属性、选课成绩关系中的“学号”与“课程号”属性组合。 外部关键字:如果表中一个字段不是本表的主关键字,而是另外一个表的关键字和候选关键字,这个字段就称为外关键字。通过外部关键字使表与表建立联系。,关系的特点,关系必须规范化 表中不能再包含表,在同一个关系中不能出现相同的属性名。 关系中不允许有完全相同的元组。 在一个关系中元组的次序无关紧要。 在一个关系中列的次序
13、无关紧要。,实际关系模型,关系数据库中,基本数据结构是二维表,表之间的联系通过不同表中的公共字段来体现。各个关系模式不是孤立的,他们不是随意堆砌在一起的一堆二维表,要正确反映事物及事物之间的联系,需要进行仔细的关系数据库设计。,1.2.2关系运算,一、传统的集合运算 并:两个相同结构关系的并是由属于这两个关系的元组组成的集合。 差:两个结构相同的关系R和S 的差是由属于R但不属于S的元组组成。 交:两个结构相同的关系R和S的交是由既属于R又属于S的元组组成的,二、专门的关系运算,1.选择 从一个关系(表)中按照一定的条件选出若干记录(行)生成一个新的关系(表)。 例如:从表中选出成绩在60分以
14、下的人员得到不及格人员成绩表。,2.投影从一个关系(表)中选出若干列生成一个新的关系(表)。 例如:从表中抽出“学号”“姓名”.“成绩”三列得到成绩表。,3. 联接 关系的横向结合,将两个关系模式拼接成一个更宽的关系模式,生成的新关系中包含满足联接条件的元组。,表1,表2,表3,合并条件: 表1.班级=表2.班级,4.自然联接在联接运算中,按照字段值对应相等为条件进行的联接操作称为等值联接。是去掉重复属性的等值联接。自然联接是最常用的联接运算。,1.3数据库设计基础,1.3.1 数据库设计步骤 一、设计原则 概念单一化“一事一地”的原则 避免在表之间出现重复字段 表中的字段必须是原始数据和基本
15、数据元素 用外部关键字保证有关联的表之间的联系,二、设计步骤,需求分析 确定需要的表 确定所需字段 确定主键 确定联系 设计求精与优化,1.3.2数据库设计过程,一、需求分析 信息需求 处理需求 安全性和完整性需求,二、确定需要的表仔细研究需要从数据库中取出的信息,遵从概念单一化“一事一地”的原则,即一个表描述一个实体或实体间的一种联系,并将这些信息分成各种基本实体。例如:在教学管理数据库中,把教师、学生、课程、选课等每个实体设计成一个独立的表。,三、确定所需字段 每个字段直接和表的实体相关 以最小的逻辑单位存储信息 表中的字段必须是原始数据 确定主关键字字段,四、确定联系 一对一联系 一对多
16、联系 多对多联系,五、设计求精 是否遗忘了字段? 是否存在大量空白字段? 是否有包含了同样字段的表? 表中是否带有大量不属于某实体的字段? 是否在某个表中重复输入了同样的信息? 是否为每个表选择了合适的主关键字? 是否有字段很多而记录很少的表,并且许多记录中的字段值为空?,1.4 SQL基本命令,1.4.1 SQL简介SQL(Structure Query Language,结构化查询语言)是在数据库系统中应用广泛的数据库查询语言,包括了数据定义、查询、操纵和控制4种功能。 主要功能:同各类数据库建立联系,进行沟通。 SQL语言中有两个基本概念:基本表和视图。,1.4.2 SQL基本语句,SE
17、LECT语句(使用最频繁) 一般格式: SELECTALL/DISTINCT *| FROM WHERE ORDER BYASC|DESC; :表示在实际的语句中要采用实际的内容进行替代 :表示可以根据需要进行选择,也可以不选 | :表示多项选项只能选其中之一 :表示必选项,如:从教师表中查找所有男教师的信息情况,可用语句 Select * From 教师 Where 性别=“男”,1.5Access简介,1.5.1Access的发展过程p20 1.5.2Access的主要特点和功能p20 1.5.3Access数据库的系统结构,对象组,表 查询 窗体 报表 数据访问页 宏 模块,所有对象都存
18、放在同一个数据库文件*.mdb中,方便了数据库文件的管理,一、表,表是数据库中用来存储数据的对象,是整个数据库系统的基础。 Access允许一个数据库中包含多个表,用户可以在不同的表中存储不同类型的数据。通过在表之间建立关系,可以将不同表中的数据联系起来,以便供用户使用。,二、查询,查询是用来操作数据库中的记录对象,利用它可以按照一定的条件或准则从一个或多个表中筛选出需要操作的字段,并可以将它们集中起来,形成所谓的动态数据集,将用户希望同时看到的来自一个或多个表中的字段显示在一个虚拟的数据表窗口中。,三、窗体,窗体是Access数据库对象中最具灵活性的一个对象,其数据源可以是表或查询。在窗体中
19、可以显示数据表中的数据,可以将数据库中的表链接到窗体中,利用窗体作为输入记录的界面。窗体是数据库与用户进行交互操作的最好界面。,四、报表,如果要打印输出数据,使用报表是很有效的方法。利用报表可以将数据库中需要的数据取出来进行分析、整理和计算,并将数据以格式化的方式发送到打印机。,五、数据访问页,是一种特殊类型的Web页,用户可以在此Web页中与Access数据库中的数据进行联接,查看、修改Access数据库中的数据。集成了Internet Explorer浏览器和FrontPage编辑器的功能。,六、宏,宏实际上是一系列操作的集合,其中每个操作都能实现特定的功能,例如:打开窗体、生成报表、保存
20、修改等。 宏可以简化用户的操作,使大量的重复性操作自动完成,从而使管理和维护Access数据库更加简单。,七、模块,模块是将Visual Basic for Applications声明和过程作为一个单元进行保存的集合,是应用程序开发员的工作环境。 通过在Access中编写Visual Basic程序,用户可以编写出复杂的、运行效率更高的数据库应用程序。 其主要作用就是建立复杂的VBA程序以完成宏等不能完成的任务。,1.6 启动和关闭Access,1.6.1 启动Access单击“开始”菜单,然后在“程序”中选择图标,即可打开Access。见下图 1.6.2 关闭Access 1、单击Access右上角的“关闭”按钮 。 2、选择“文件”菜单中的“退出”命令。 3、使用Alt+F4快捷键。 4、使用Alt+F+x快捷菜单命令。,考点: 理解数据库、数据模型、数据库管理系统的概念。 了解数据库管理技术的发展过程中经历的几个阶段 了解常用的三种数据模型及特点。 理解和掌握关系、元组、属性、字段、域、关键字等概念。 能够灵活使用专门的关系运算。(选择、投影、连接),