1、大型数据库技术,软件学院宋薇Email:,课程介绍,课程名称:大型数据库技术教 材:Oracle 数据库管理、开发与实践,杨永健等编著,人民邮电出版社,2013年9月参考资料: Oracle 10g数据库管理、应用与开发,马晓玉等编著,清华大学出版社,2007年11月教学方式:授课(38)+上机实践(10)考核方式:期末大作业60%,实验成绩30%,考勤10%实验、考勤任一项超过三次未到/交,取消考试资格!问题:课堂、课后、电子邮件,课程目标,了解Oracle数据库的基础掌握Oracle的基本安装配置和常用工具的使用(OEM、SQL*Plus)(留一个综合任务)理解Oracle体系结构掌握SQ
2、L语言的应用掌握PL/SQL程序设计(留一个综合点的任务)掌握Oracle的基本对象管理(留一个综合点的任务)掌握Oracle安全管理及备份恢复(留一个综合点的任务)能综合使用Oracle数据库进行应用与开发实验安排,课程目标,完成这一课的学习后,您应该能达到下列目标: 了解关系数据模型的相关知识,并能根据实际的应用创建数据库,并对数据库进行规范化设计;了解Oracle产品的特点,熟悉Oracle 11g的新特性;熟练运用Oracle 11g实现数据库的创建和管理;掌握Oracle数据库的启动与关闭。掌握Oracle企业管理器(OEM)和SQL*PLUS工具的使用方法。,Oracle数据库学习
3、常见问题问答,Question:数据库有好多版本,我应该学习哪个?Answer:万物一理,数据库的版本虽然多,本质是一样的,变化的只是表象,你是oracle7的专家,一定也是oracle10g的专家。Question:数据库存在好多平台,我应该学习哪个?Answer:各个平台上有差别,很小。Windows是最好的学习平台。Question:有好多管理数据库的工具,我应该使用哪个?Answer:Sqlplus最好的管理工具,当你只用sqlplus管理数据库的时候,你就掌握oracle了。Question:数据库学习中哪部分最难?Answer:Sql语句,永远是sql,书写高效的sql是我们永恒的
4、目标。Question:学习数据库的基本课程是哪部分?Answer:体系结构,它是备份和优化数据库的基石。Question:图形界面对数据库学习有帮助吗?Answer:有害无益,第1章 Oracle 关系数据库,本章内容,关系数据库基础 Oracle数据库基础 Oracle11g的安装与卸载 Oracle11g常用工具的初次使用 数据库的启动与关闭,1.0 Oracle数据库系统,Oracle数据库简介 Oracle数据库发展史 Oracle数据库特点Oracle数据库的应用结构,Oracle是殷墟出土的甲骨文(oracle bone inscriptions)的英文翻译的第一个单词,在英语里
5、是“神谕”的意思。,ORACLE系统概述,ORACLE具有甲骨文之意,是全世界第二大软件公司。由来:1977年6月Larry Ellison(耶鲁大学未毕业,和Bill Gate同时代)和另外两个伙伴Bob Miner,Ed Oates硅谷成立一个软件开发实验室(ORACLE前身)。由于创始人对中国的向往,用中国最古老的文字甲骨文为软件名字。所以ORACLE又称甲骨文。该公司主要从事:数据库、电子商务套件、erp、财务产品、开发工具培训认证。 目前,大型电子商务网站,跨国公司,国家大型企业、部门(银行、电力、铁路、航空、地税、国税、公安、保险、农村信用联社)都使用ORACLE作为数据库。Sql
6、 server只能在windows下运行,windows服务器的性能很难保证,但ORACLE可以在多种平台上运行,尤其是Unix平台,性能很好。,Oracle总裁LarryEllison,埃里森在32岁以前他还一事无成, 读了三个大学,没得到一个学位文凭, 换了十几家公司,老婆也离他而去,开始创业时只有1200美元,却使得oracle公司连续十二年销售额每年翻一翻,成为世界上第二大的软件公司,他自己也成为硅谷首富.ellison的经营手腕和强力,击败了一个又一个的对手, ellison要打倒的最后一个目标就是软件帝国之王微软的比尔.盖茨。 ellison被财富杂志列为世界上第五富的人, 他拥有
7、的oracle是世界上最大的数据库软件公司.oracle公司也许并不为大众所知,但当你从自动提款机上取钱,或者在航空公司预定航班,或者网上购物,你就在和oracle打交道,oracle的客户大多是赫赫有名,名列财富家的大型公司。,为了纪念他的突出成就,现 Scott是Oracle系统的默认登录用户名之一。10G前版本,创建数据库后即可使用该用户账户登录,10G后版本默认锁定该账户,Bruce Scott是公司发起人之一,Oracle数据库简介,Oracle公司是全球最大的信息管理软件及服务供应商 世界第二大独立软件企业,仅次于Microsoft公司 全球500强企业,有70%在使用Oracle
8、技术,包括十大B2C公司和十大B2B公司中的9家财富100强中的98家公司都采用Oracle技术 全球10大银行均采用Oralce应用系统通信领域,全球20家顶级通信公司都在使用Oracle 应用产品中国前100大IT公司,都有Oralce技术的应用,行业动态,2009年南阳市政府网站群系统评标中,郑州一个公司安装双机热备系统(oracle),自己公司无人会装,找人安装熟人价格5000元南阳市电业局培训,每天给讲师培训费将近2000南阳防爆集团进行oracle数据库培训社会上oracle数据库培训,3-5天,5000左右,中长期oracle系统培训10000以上。南阳市各个大的单位部门都有信息
9、中心,都需要相关人员,但目前都没有专业人员,南阳市第一、二人民医院(马上还要给他们做oracle方面的培训),农村信用社,公安局,南阳市政府,中国银行等,都帮他们做过维护工作08级专科一个学生搞oracle,目前月薪1.5W;另外一个同学,才就业就培训重点高校的应届毕业生,自己接私活,已到加拿大一个电子商务公司去工作(出国),公司一般DBA月薪2-5W,Oracle数据库简介,2011年、2013年 数据库产品市场占有率,常见的关系数据库管理系统,ORACLE DB2 Sybase SQL Server开放性可伸缩性安全性性能客户端使 用性可操作性产品组成,Oracle 数据库发展史,1977
10、年,SDL(Software Development Laboratories)1979年,RSI(Relational Software Inc.),产品命名 0racle2.01983年3月,Oracle,oralce3.01984年10月,oracle4.01985年,oracle5.01988年,oracle6.001992年,oracle7.01997年6月,oracle8.01998年9月,oracle8i2000年12月,oracle9i2003年9月,oracle10G 2007年7月,oracle11g 2013年6月, Oracle12C,第一个可以在C/S模式下运行的RD
11、BMS产品,全面支持Internet技术及全方位的Java技术,第一个基于网格计算的RDBMS,基于UNIX,采用多线程服务器体系结构MTS,基于Java,可构造大型应用系统,Oracle数据库特点,支持多用户、大事务量的事务处理 提供标准操作接口 实施安全性控制和完整性控制 支持分布式数据处理 具有可移值性、可兼容性和可连接性,是Oracle 公司开发的一款数据库平台,包括数据库管理系统G是Grid的缩写,表示支持网格结构在Oracle中可以存储大量共享的、相互关联的数据。(Oracle是EB级的数据库。1EB=10241024TB,1TB=1024GB)Oracle提供了高效的数据检索机制
12、,Oracle11g 简介,Oracle11g数据库的新特性,网格计算数据库 Oracle真正应用集群(Oracle Real Application Clusters)自动存储管理 信息供应数据库自动管理 物化视图与查询重写 闪回版本查询与闪回错误操作 数据泵 其他新特性大表空间、多个默认临时表空间、异构平台间传输表空间、SYSAUX系统表空间、自动统计信息收集、强化在线重定义、简化共享服务器配置、加强会话跟踪、SGA区动态管理、表数据的透明加密、增加分区数量等特性。,Oracle数据库的应用结构,随着计算机技术、特别是网络技术的迅速发展,数据库技术也取得了长足的发展。对数据库的使用方式提出
13、了不同的要求。除客户服务器(C/S)系统结构外,还出现了浏览器(B/S)结构以及分布式数据库系统结构。,下面简要介绍Oracle数据库应用系统的不同结构:分布式数据库系统客户-服务器结构(C/S)终端-服务器结构 浏览器-服务器结构 (B/S),Oracle分布式数据库结构,数据库系统可按数据分布方式分为集中式数据库和分布式数据库。集中式数据库是将数据集中存放在一台计算机上,而分布式数据库系统是将数据存放在由计算机网络联接的不同的计算机上。 一个分布式数据库是由分布于计算机网络上的多个逻辑相关的数据库组成的集合,网络每个节点具有独立处理能力,可以执行局部应有,也可通过网络执行全局应用。,Ora
14、cle分布式数据库结构,特点:数据分布数据共享兼容性好网络扩展性好,Oracle客户/服务器结构,客户/服务器结构(C/S)是软件系统较为流行一种工作模式。在C/S结构模式中,所有的数据集中存储在服务器中,数据处理由服务器完成,一般采用硬件资源配置比较高的机器作为服务器,而使用配置比较低的PC机作为客户端。服务器与客户端之间通过专用网络联接,一般为局域网或企业内部网。,Oracle客户/服务器结构,优点:客户机与服务器可采用不同软、硬件系统,应用与服务分离,安全性高、执行速度快。缺点:维护升级不方便。,终端/服务器结构,结构与客户机/服务器结构类似,不同之处在于:所有软件安装、配置、运行、通信
15、、数据存储等都在服务器端完成;终端只作为输入、输出的设备,终端没有处理能力。优点:便于实现集中管理、系统安全性高、网络负荷低,终端设备要求低。缺点:对服务器性能要求高。,Oracle 浏览器/服务器结构,随着网络技术的迅速发展,基于Web的产品和标准的出现,使以Web技术为先导的Internet得到了迅猛发展。信息在Internet上的交换与发布都需要数据库的参与。使用Oracle数据库作为后台,通过ODBC和JDBC连接数据库,应用JSP、ASP和PHP开发,形成了动态网页的设计主流。,Oracle 浏览器/服务器结构,优点:通过Web服务器处理应用程序逻辑,方便了应用程序的维护和升级。缺点
16、:增加了网络连接,降低了执行效率,同时降低了系统的安全性。,1.1 数据库基础,数据库基础关系数据模型关系与关系模式数据库的设计关系数据库规范化理论,关系数据库基础,数据(Data)所谓数据(Data),就是描述事物的符号,在我们的日常生活中数据无所不在,数字、文字、图表、图像、声音等都是数据。人们通过数据来认识世界,交流信息数据库(Data Base,简称DB) 顾名思义就是存放数据的仓库。只不过这个仓库是在计算机存储设备上,而且数据是按一定的格式存放的。 所谓数据库,就是按一定的组织结构,长期存储在计算机内、大量的、可共享的数据集合。数据库是数据库系统的核心部分,是数据库系统的管理对象。,
17、关系数据库基础,数据库管理系统 数据库管理系统(DataBase Management System,简称DBMS)是位于用户与操作系统之间的一层数据管理软件。它主要实现科学地组织和存储数据库,高效地获取和维护数据,保护数据的安全性 。具有数据定义、管理和操纵功能的软件集合。 数据库管理系统是数据库系统的一个重要组成部分。 数据库管理系统的目标是让用户能够更方便、更有效、更可靠地建立数据库和使用数据库中的信息资源。 数据库管理系统能够为事务管理提供技术和方法、应用系统的设计平台和设计工具,使相关的事务管理软件很容易设计。 也就是说,数据库管理系统是为设计数据管理应用项目提供的计算机软件,利用数
18、据库管理系统设计事务管理系统可以达到事半功倍的效果。,关系数据库基础,关系型数据库管理系统(RDBMS)一个RDBMS就是一组相关数据的集合数据是以行和列的形式保存。每个属性称为一列,每一个记录称为行。表可以通过一列或多列与其他表或多个表进行关联。SQL Server 及Oracle 9i以前的版本都属于RDBMS对象型关系数据库(ORDBMS)ORDBMS在RDBMS的基础上加入了对象的概念ORDBMS包括Oracle 9i和Oracle 10G、Oracle 11g以及最新的Oracle 12C,关系数据库基础,数据库系统(Database System,简称DBS),是指在计算机系统中引
19、入数据库后的系统构成。 数据库系统一般由以下部分的构成:数据库数据库管理系统(及其开发工具)应用系统数据库管理员用户,关系数据模型,数据库技术始于20世纪60年代。当时计算机的主要应用领域正由科学计算逐步转向事条处理,这一转变促进了数据库技术的发展。到20世纪70年代,数据库技术达到了飞速的发展。 E.F.Coddd教授发表了“大型共享数据库数据的关系模型”论文,他提出了关系数据库理论和模型,为关系数据库模型奠定了理论基础,从而使数据库技术成为计算机科学的一个重要分支。 从1968年IBM公司推出的层次数据库开始,几十年来,数据库技术得到了迅速发展,先后出现了层次数据库、网状数据库和关系数据库
20、,以及后来出现的面向对象数据库。关系数据库是目前应用最广泛的数据库。,关系数据模型,关系模型 关系模型(Relational Model)把世界看作是由实体Entity和联系Relationship构成的。实体 现实世界中具有区分于其它事物的特征或属性集合。实体通常是以表的形式来表现的。表的每一行描述实体的一个实例,表的每一列描述实体的一个特征或属性。如:部门,汽车,员工,通讯录联系 实体之间的关系。通过联系,就可以通过一个实体,查找相关实体,使系统形成一个有机的整体。关系模型基本特征就是二维表。,关系数据模型,关系数据库 以关系模型作为数据模型的数据库管理系统就是关系数据库。,关系数据模型主
21、要包括以下三个方面: 关系数据结构关系数据操作关系完整性约束,关系数据结构,在关系数据库系统中,关系是关系数据模型的核心。关系数据库系统中最主要的数据结构就是关系。在实际的表示中,关系可以用一个由“行”和“列”组成的二维表来直观地表示。表中的每一列表示为关系的一个属性,每列的名字即为一个属性名,每一行表示一个记录代表一个物理实体。,关系模型的数据结构非常单一。在用户看来,关系模型中数据的逻辑结构是一张二维表。无论是实体还是实体间的联系均由关系(表)来表示。,关系操作,关系操作采用集合操作方式,即操作的对象和结果都是集合。这种方式也称为一次一集合的方式.,查询操作 选择、投影、连接、除、并、交、
22、差更新操作增加、删除、修改,关系操作包括查询操作和更新操作两部分。其中,查询操作是其最重要的部分。,关系的完整性约束,关系模型的完整性规则是对关系的某种约束条件。关系模型允许定义三类完整性约束:实体完整性(Entity Integrity)实体完整性规定当前关系的所有元组的主属性不能取空值。参照完整性(Referential Integrity)实体之间存在的某种联系,也就是关系之间存在的引用。用户定义的完整性(User-defined Intergrity) 就是用户针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。,关系的完整性约束,实体完整性和参照完整性
23、是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系数据库系统自动支持。用户定义的完整性是应用领域需要遵循的约束条件,体现了具体领域中的语义约束。 为了维护数据库中的数据完整性,在对关系数据库执行插入、删除和修改等操作时,必须遵守这三类完整性规则。,关系与关系模式,在数据库中要区分型和值,型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。在关系数据库中,关系模式是型,关系是值,关系模式是对关系的描述。因为关系实质上是一个二维表,表中的每一行在关系模式中被称为元组,一个元组由许多属性组成,也就是表中的列。关系是元组的集合,因此关系模式必须指出这个元组集合的结构,即它
24、由哪些属性组成,以及这此属性的取值等。,关系的描述称为关系模式。一个关系模式应当是一个五元组,它可以表示为: R(U, D, dom, F) 其中R为关系名,U为组成该关系的属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象集合,F为属性间数据的依赖关系集合。 关系是关系模式在某一时刻的状态和内容。 关系模式 是静态的、稳定的,而关系动态的、随时间不断变化的,因此关系操作在不断地更新数据库中的数据。,数据库设计,在数据库的设计过程中,有许许多多需要考虑的因素,如数据库的背景、应用环境等方面都需要有深入的了解,只有对这些因素都进行详细分析,设计的数据库才能易于使用和维护,并且具有高
25、效和一致的特征。 对数据库的设计包括以下过程:信息的收集(需求分析)确定数据(数据字典)建立实体-联系模型(概念设计)进行规范化(逻辑设计)编写SQL语句,创建数据库(物理设计及数据库实施),实体-联系模型,实体关系模型也称为E-R数据模型(Entity-Relationship data Model)。设计E-R数据模型的出发点是为了有效和更好地模拟现实世界,而不需要考虑在机器中如何实现。下面介绍E-R数据模型的三个抽象概念。实体(Entity)实体是客户世界中可以相互区别,并被识别的事务。属性(Attribute)实体的一般特征,称之为实体的属性联系(Relationship) 一对一联系
26、(1:1) 一对多联系(1:m) 多对多联系(m:n),E-R图的绘制,实体-关系图是表现实体-关系模型的图形工具,简称E-R图。E-R图提供了用图形表示实体、属性和联系的方法。在E-R图中,约定实体用方框表法,属性用椭圆表示,联系用菱形表示,并其内部填上实体名、属性名、联系名。,用E-R图表示某个工厂物资管理的概念模型实体仓库: 仓库号、面积、电话号码零件 :零件号、名称、规格、单价、描述供应商:供应商号、姓名、地址、电话号码、帐号项目:项目号、预算、开工日期职工:职工号、姓名、年龄、职称实体之间的联系如下: 一个仓库可以存放多种零件,一种零件可以存放在多个仓库中。仓库和零件具有多对多的联系
27、。用库存量来表示某种零件在某个仓库中的数量。一个仓库有多个职工当仓库保管员,一个职工只能在一个仓库工作,仓库和职工之间是一对多的联系。职工实体型中具有一对多的联系 职工之间具有领导-被领导关系。即仓库主任领导若干保管员。供应商、项目和零件三者之间具有多对多的联系,E-R图的绘制,将E-R模型转化为关系模式,在E-R模型建立后,就可以将实体、实体间的联系等模型转变为关系模式,即生成数据库中的表,并确定表的列。下述讨论由E-R模型生成表的方法。 实体转化为表 对E-R模型中的每个实体,在创建数据库时相应地为其建立一个表,表中的列对应实体的属性,主属性就作为表的主键 。 实体间联系的处理一对一关系的处理一对多关系的处理多对多关系的处理,关系数据库规范化理论,据库理论与设计中有一个重要的问题,就是在一个数据库中如何构造合适的关系模式,它涉及一系列的理论与技术,从而形成了关系数据库设计理论。由于合适的关系模式要符合一定的规范化要求,所以又可称为关系数据库的规范化理论。 规范化理论主要包括:函数依赖完全函数依赖、部分函数依赖、传递函数依赖、平凡函数依赖、非平凡函数依束。范式理论 第1范式、第2范式、第3范式、BCNF范式。,总结,数据库的基本概念关系数据模型关系与关系模式数据库的设计关系数据库的规范化理论,