收藏 分享(赏)

mis_C5数据库技术.ppt

上传人:dreamzhangning 文档编号:2195803 上传时间:2018-09-05 格式:PPT 页数:65 大小:1.84MB
下载 相关 举报
mis_C5数据库技术.ppt_第1页
第1页 / 共65页
mis_C5数据库技术.ppt_第2页
第2页 / 共65页
mis_C5数据库技术.ppt_第3页
第3页 / 共65页
mis_C5数据库技术.ppt_第4页
第4页 / 共65页
mis_C5数据库技术.ppt_第5页
第5页 / 共65页
点击查看更多>>
资源描述

1、管理信息系统,第5章 数据库技术,第5章 数据库技术,了解有关数据库的基本概念,了解关系数据库基础知识,了解数据库的设计基本方法,了解数据仓库与数据挖掘基础知识,第5章 数据库技术,主要内容 5.1 数据库系统概述 5.2 关系数据库 5.3 SQL语言 5.4 数据库设计 5.5 数据仓库和数据挖掘 5.6 数据库技术的发展,第5章 数据库技术,第5章 数据库技术,5.1 数据库系统概述,主要内容 5.1.1 有关数据库系统的基本概念 5.1.2 数据管理技术的发展 5.1.3 关系模型,第5章 数据库技术,5.1.1 有关数据库系统的基本概念 1数据库数据库(Database)是长期存储在

2、计算机内、大量的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型进行组织、描述和储存,它有以下特点: 最小冗余:数据库中的数据尽可能不重复。 数据独立性:数据库中数据与应用程序没有依赖关系。 安全性:保护数据库,以防止不合法使用。 完整性:存取数据库中数据的过程要确保其正确性、一致性和有效性。 数据共享:数据库中的数据可以同时为多个用户和多个应用程序服务。,5.1 数据库系统概述,第5章 数据库技术,5.1.1 有关数据库系统的基本概念 2数据库管理系统数据库管理系统(Database Management System,DBMS)是一个用来管理数据库的软件系统,它能科学地组织和存

3、储数据,以高效地获取和维护数据。数据库管理系统是位于用户与操作系统之间的一层数据管理软件,主要用来定义和管理数据库,处理数据库与应用程序之间的联系。它的主要功能包括以下几个方面:数据定义功能、数据操纵功能、数据库的运行管理、数据库的建立和维护功能。,5.1 数据库系统概述,第5章 数据库技术,5.1.1 有关数据库系统的基本概念 3数据库系统数据库系统(Database System,DBS)是指基于数据库的一个人机系统,主要包括数据库、数据库管理系统、应用系统、数据库管理员和用户。数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。这样既便于数据的集中管理,

4、又有利于应用程序的研制和维护,提高了数据的利用率和相容性,提高了决策问题的可靠性。,5.1 数据库系统概述,第5章 数据库技术,5.1.2 数据管理技术的发展在应用需求的推动下,以及计算机软、硬件发展的基础上,数据管理技术经历了人工管理、文件系统和数据库系统三个阶段。 1人工管理从1946年计算机诞生至20世纪50年代中期,计算机主要用于科学计算。计算机除硬件设备外没有任何软件可用,使用的外存只有磁带、卡片和纸带,没有磁盘等直接存取设备。对数据的处理,完全由人工进行管理。,5.1 数据库系统概述,第5章 数据库技术,5.1.2 数据管理技术的发展 2文件系统20世纪50年代后期到60年代中期,

5、计算机不仅用于科学计算,也大量用于经营管理活动。硬件设备有了磁盘、磁鼓等直接存储设备;软件发展了操作系统和各种高级语言。人们可以将应用程序所需的大量数据组织成一个数据文件长期保存在直接存取存储设备上,利用操作系统中的文件管理随时可以对文件中的数据进行存取,并且只需要知道了相应的文件名即可实现按名存取。,5.1 数据库系统概述,第5章 数据库技术,5.1.2 数据管理技术的发展 3数据库系统20世纪60年代后期开始,存储技术有了很大的发展,产生了大容量磁盘。计算机用于管理的规模更加庞大,数据量急剧增长,原有文件系统的固有缺陷使之不能满足大量应用和用户对数据的共享性和安全性等需求。为了提高效率,人

6、们着手开发和研制更加有效的数据管理模式,并由此提出了数据库的概念。,5.1 数据库系统概述,第5章 数据库技术,5.1.2 数据管理技术的发展 3数据库系统1968年,IBM公司研制成功数据库管理系统(Information Management System,IMS)标志着数据管理技术进入了数据库阶段。IMS为层次型数据库。1969年,美国数据系统语言协会(Conference On Data System Language)公布了数据库工作组报告,对研制开发网状数据库起了巨大推动作用。1970年,IBM公司的研究员E F. Codd连续发表论文,奠定了关系数据库的基础。,5.1 数据库系统

7、概述,第5章 数据库技术,5.1.2 数据管理技术的发展 3数据库系统用数据库系统管理数据的基本思想是:将整个系统(包括每一个部门及其应用程序)涉及的所有数据按一定的结构集中存放在数据库中,由数据库管理系统负责统一的数据管理和数据控制,用户或应用程序通过数据库管理系统操作数据库,存取其中的数据。数据库系统的数据存取模型如下图所示。,5.1 数据库系统概述,第5章 数据库技术,5.1.3 数据库模型模型是对现实世界中信息、内容的模拟和抽象表达,人们通过模型就可以联想到现实生活中的事物。比如,买房时,通过楼房的模型图可以想象房屋建成后的结构、布局和周围情况等。数据模型也是一种模型,它是对现实世界数

8、据特征的抽象。数据库是数据的集合,它不仅反映数据本身的内容,而且反映数据之间的联系。由于计算机不可能直接处理现实世界中的具体事物,所以必须把具体事物转换成计算机能够处理的数据。在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲,数据模型就是对现实世界的模拟。,5.1 数据库系统概述,第5章 数据库技术,5.1.3 数据模型数据模型是数据库系统的一个核心问题,是对客观事物及其联系的数据化描述,是数据库系统设计中用于提供信息表示和操作手段的形式结构,是DBMS实现的数学基础。目前,数据模型主要有三种:层次模型(Hierarchical model)、网状模型(Netwo

9、rk model)和关系模型(Relational model)。其中关系模型是三种数据模型中最重要的模型。20世纪80年代以来,计算机系统商推出的数据库管理系统几乎全部是支持关系模型的。,5.1 数据库系统概述,第5章 数据库技术,5.1.3 数据模型 1层次模型层次模型是最早用于数据库技术的一种数据模型,它是按层次结构来组织数据的。层次结构也称为树形结构,树中的每一个节点代表一种实体类型。这些节点满足两个条件: (1)有且仅有一个节点无双亲。 (2)其他节点有且仅有一个双亲节点。,5.1 数据库系统概述,第5章 数据库技术,5.1.3 数据模型 1层次模型层次模型是现实世界存在的各种数据关

10、系的抽象和反映,企业组织、产品结构以及家庭关系都呈现层次结构。例如,院系的组织结构图,就是非常典型的层次结构,如下图所示。,5.1 数据库系统概述,第5章 数据库技术,5.1.3 数据模型 2网状模型层次模型中一个节点只能有一个双亲节点,对于更复杂的实体间联系就很难描述了。网状模型中,节点间的联系是任意的,任意两个节点间都能发生联系,更适于描述客观世界。虽然,网状模型适于“描述”现实实体,但在计算机处理时却增加了复杂度,比如如果实体之间存在M:N这样的联系,数据结构的组织和处理将十分繁杂。因此,在已经实现的网状数据库中,一般只处理1:M的联系;对于M:N关系,要先转换成1:M联系,然后再处理。

11、通常也将只有1:M关系的网称为简单网,而将存在M:N 关系的网称为复杂网。网状模型典型代表是DBTG系统。,5.1 数据库系统概述,第5章 数据库技术,5.1.3 数据模型 3关系模型关系模型是目前最重要的一种数据模型。20世纪80年代以来,几乎所有的数据库系统都支持关系模型,非关系模型也增加了关系模型接口,关系型数据库已经成为数据库系统的工业标准。关系模型的数据结构是用二维表格表达的实体集,与前两种数据模型相比,其数据结构相对简单。在现实世界中,人们经常使用各种表格,如履历表、报名表、统计表、调查表来表示信息,这些表格可以非常直接地转化为计算机存储信息。,5.1 数据库系统概述,第5章 数据

12、库技术,5.1.3 数据模型 3关系模型关系模型是目前最重要的一种数据模型。20世纪80年代以来,几乎所有的数据库系统都支持关系模型,非关系模型也增加了关系模型接口,关系型数据库已经成为数据库系统的工业标准。关系模型的数据结构是用二维表格表达的实体集,与前两种数据模型相比,其数据结构相对简单。在现实世界中,人们经常使用各种表格,如履历表、报名表、统计表、调查表来表示信息,这些表格可以非常直接地转化为计算机存储信息。,5.1 数据库系统概述,第5章 数据库技术,5.2 关系数据库,主要内容 5.2.1 关系数据库概述 5.2.2 关系的完整性 5.2.3 常见的关系数据库,第5章 数据库技术,5

13、.2.1 关系数据库概述 关系数据库系统是支持关系模型的数据库系统。关系数据库中数据的基本结构是二维表(Table),即数据按行、列有规则地排列、组织。数据库中每个表都有唯一的表名。下面介绍关系模型中的基本术语。关系(Relation):关系在逻辑上对应一个按行、列排列的二维表,表名就是关系名。属性(Attribute):表中的一列称为一个属性(或称一个字段),每个属性起一个名字,即为属性名。域(Domain):属性的取值范围称为域。例如,性别的域是(男、女);院系的域是学校所有院系的集合。,5.2 关系数据库,第5章 数据库技术,5.2.1 关系数据库概述 元组(Tuple):表中的每一行称

14、为元组,又称记录(Record)。候选码(Candidate Key):如果一个属性或属性集的值能够唯一标识一个关系的元组,又不包含多余的属性,则称该属性或属性集为候选码,又称候选关键字或候选键。在一个关系上可以有多个候选码。主键(Primary Key):在关系模型中,不允许一个表中有两个完全相同的元组,表中能够唯一标识元组的一个属性或属性集合称为主键(或称主码)。主键是多个候选码中的一个。主键可以由一个属性组成,也可以由多个属性共同组成。主属性(Prime Attribute):主键的诸属性称为主属性。,5.2 关系数据库,第5章 数据库技术,5.2.1 关系数据库概述 外键(Foreig

15、n Key):如果一个属性或属性集合不是某个关系的主键,而是另外一个关系(称为被参照关系)的主键,则这个属性或属性集合称为该关系(称为参照关系)的外键(或称外码)。关系模式(Relation Schema):二维表的结构称为关系模式。对关系的描述,一般表示为:关系名(属性1,属性2,属性n)。,5.2 关系数据库,第5章 数据库技术,5.2.2 关系的完整性 为了使数据能够符合现实世界的要求,保证数据的正确性、有效性和相容性,关系模型允许定义三类完整性约束条件:实体完整性、参照完整性和用户自定义的完整性,其中,实体完整性和参照完整性是关系模型必须满足的两类完整性约束条件。,5.2 关系数据库,

16、第5章 数据库技术,5.2.3 常见的关系数据库 目前有许多关系数据库产品,如Oracle、Sybase、Informix、Microsoft SQL Server、Microsoft Access、Visual FoxPro等,这些产品各以自己特有的功能,在数据库市场上占有一席之地。,5.2 关系数据库,第5章 数据库技术,5.3 SQL语言,主要内容 5.3.1 SQL语言概述 5.3.2 SQL语言的特点 5.3.3 SQL语言的组成,第5章 数据库技术,5.3.1 SQL语言概述 SQL语言是结构化查询语言(Structured Query Language)的缩写,是一种用于数据库的

17、定义、操纵、控制、查询和编程的语言。SQL语言是在1974年由Boyce和Chamberlin提出的。19751979年IBM公司San Jose Research Laboratory研制了著名的关系数据库管理系统原型System R并实现了这种语言,当时称为SEQUEL(Structured English Query Language)。在1981年,IBM公司推出商品化的关系DBMS SQL/DS,并将SEQUEL改名为SQL。,5.3 SQL语言,第5章 数据库技术,5.3.1 SQL语言概述 1986年10月,美国国家标准局(American National Standard I

18、nstitute,ANSI)数据委员会X3H2批准了SQL作为关系数据库语言的美国标准,同年公布了SQL标准文件(SQL-86)。1987年国际标准化组织(International Organization for Standardization,ISO)也通过了这一标准。此后,ANSI不断更新和完善SQL标准,并于1989年公布了SQL-89标准,1992年又公布了SQL-92标准,增加面向对象功能的SQL-99也于1999年公布。,5.3 SQL语言,第5章 数据库技术,5.3.1 SQL语言概述 自SQL成为国际标准以后,各个数据库厂家纷纷推出各自的SQL软件或与SQL的接口软件。这使

19、大多数数据库均用SQL作为共同的数据存取语言和标准接口,使不同数据库系统之间的互操作有了共同的基础。SQL成为国际标准对数据库以外的领域也产生了很大影响,有不少软件产品将SQL语言的数据库查询功能与图形功能、软件工程工具、软件开发工具、人工智能程序结合起来。SQL已成为数据库领域中的一个主流语言。,5.3 SQL语言,第5章 数据库技术,5.3.2 SQL语言的特点 SQL是一种介于关系代数与关系演算之间的结构化查询语言,是一个通用的、功能极强的关系数据库语言。SQL之所以能够为用户和业界所接受并成为国际标准,正是因为它是一个综合的、功能极强又简捷易学的语言。其主要特点包括5个方面:1综合统一

20、2高度非过程化3面向集合的操作方式4以同一种语法结构提供两种使用方式5语言简捷,5.3 SQL语言,第5章 数据库技术,5.3.3 SQL语言的组成 SQL语言主要由数据定义语言(Data Definition Language,DDL)、数据操纵语言(Data Manipulation Language,DML)和数据控制语言(Data Control Language,DCL)三部分组成。,5.3 SQL语言,第5章 数据库技术,5.3.2 SQL语言的组成 数据定义语言:定义和管理数据库以及数据库中的各种对象,包括CREATE、ALTER、DROP等语句,如CREATE TABLE(创建

21、表)、DROP TABLE(删除表)等。 数据操纵语言:查询、添加、修改和删除数据库中数据,包括SELECT(查询数据)、INSERT(插入记录)、DELETE(删除记录)、UPDATE(修改数据)等语句。 数据控制语言:设置或者更改数据库用户或角色权限,包括GRANT(授予权限)、REVOKE(取消权利)、COMMIT(事务提交)、ROLLBACK(事务撤消)等语句。,5.3 SQL语言,第5章 数据库技术,5.4 数据库设计,主要内容 5.4.1 数据库设计的方法 5.4.2 数据库设计的基本步骤 5.4.3 数据库设计应用举例,第5章 数据库技术,5.4.1 数据库设计的方法 早期的数据

22、库设计没有现成的规范可循,缺乏科学理论和工程方法的支持,设计人员完全凭自己的经验和技巧自主地设计数据库,设计质量难以保证,这种方法叫做手工试凑法。为此,30多个国家的数据库专家于1978年10月在美国新奥尔良市专门讨论了数据库设计问题,提出了数据库设计的规范,这就是著名的新奥尔良方法。新奥尔良方法属于规范设计法,即运用软件工程思想,将设计过程分为若干阶段和步骤,按照工程化的方法设计数据库。新奥尔良方法将数据库设计分成需求分析、概念设计、逻辑设计和物理设计四个步骤。,5.4 数据库设计,第5章 数据库技术,5.4.1 数据库设计的方法 现在常用的规范设计法大多起源于新奥尔良方法,只是在数据库设计

23、的不同阶段上采用了某些具体的技术和方法,例如,基于实体-联系(Entity-Relationship,简称 E-R)模型的数据库设计方法、基于第三范式(3 Normal Form,简称3NF)的数据库设计方法等。,5.4 数据库设计,第5章 数据库技术,5.4.1 数据库设计的方法 基于E-R模型的数据库设计方法采用E-R方法来设计数据库的概念模型(属于概念设计阶段),即用E-R图表示现实世界中的实体以及实体之间的联系,然后将其转换为某一具体的数据库管理系统所支持的数据模型。基于3NF的数据库设计方法则采用规范化理论来设计关系数据库的数据模型(即逻辑模型,属于逻辑设计阶段),即在需求分析的基础

24、上确定数据库模式中存在的全部属性及其依赖关系,先将它们组织在一个单一的关系模式中,然后通过模式分解将其规范化为若干个3NF关系模式的集合。,5.4 数据库设计,第5章 数据库技术,5.4.1 数据库设计的方法 目前已有一些工具软件可以通过人机交互方式来辅助设计人员完成数据库设计过程中的很多任务,这样的工具软件统称为CASE(Computer-Aided Software Engineering,计算机辅助软件工程),例如,Oracle公司的Designer、Sybase公司的PowerDesigner、Microsoft公司的Visio、CA公司的ERWin、Rational公司的Ration

25、al Rose等。,5.4 数据库设计,第5章 数据库技术,5.4.2 数据库设计的基本步骤 按照规范设计法,可以将数据库设计的全过程分为以下六个基本阶段: 需求分析 概念结构设计 逻辑结构设计 物理结构设计 数据库实施 数据库运行和维护,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 1需求分析在进行数据库设计之前,首先必须准确了解和分析各种用户的应用需求。对于学生成绩管理系统,假定学校只有一种类型的学生,每名学生有惟一的一个学号,还有姓名、性别、年龄、班级等基本信息。学校开设了多门课程,每门课程有惟一的一个课程号,还有课程名、学分、课程简介等基本信息。每名学生可以根

26、据需要可以有选择地选修多门课程,同时每门课程也可以供多名学生选修。在学期末,学生的所选课程成绩会输入到数据库中,供学生在网上进行查询。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 2概念结构设计概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合、归纳和抽象,形成独立于任何数据库管理系统的概念模型,概念结构设计的主要工具是E-R模型。E-R模型有四个基本成分:矩形表示实体,椭圆形表示实体属性,菱形表示联系,连线表示实体之间以及属性之间的联系。矩形框、椭圆形框、菱形框内要标注实体、属性和联系的名字,连线两头标注联系的类型是一对一、一对多还是多对多的联系。,5.

27、4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 2概念结构设计首先,根据用户需求,分析潜在的实体。针对学生成绩管理系统,显然可以找出学生和、课程这2个实体,因为该系统的主要活动课程的选修以及成绩的输入与查询都是围绕这2个实体开展的。每一个实体都有相应的属性来描述它。其次,根据用户需求,确定实体之间的联系。在本系统中,选修就是这2个实体之间发生的主要动作。由于一名学生可以选修不同课程,一门课程可以由不同学生选修,因此,这2个实体之间的选修联系是一个多对多联系(m:n)。选修联系发生后,会产生一个基本属性,这就是要向数据库输入的课程成绩。,5.4 数据库设计,第5章 数据库技术

28、,5.4.3 数据库设计应用举例 2概念结构设计根据以上分析,可以画出学生成绩管理系统的E-R图。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 3逻辑结构设计逻辑结构设计是将概念模型转换为某一具体数据库管理系统支持的数据模型(即逻辑模型,如关系模型),并对其进行优化。关系模型是最常用的逻辑模型,其数据结构是关系,用关系模式进行描述,因此所有这些关系模式的集合就构成了关系数据库的逻辑模式(即关系模型)。因此,概念模型向逻辑模型的转换,实际上就是要将E-R图中的实体以及实体之间的联系转换为若干个关系模式,并确定其中的属性和码。,5.4 数据库设计,第5章 数据库技术,5

29、.4.3 数据库设计应用举例 3逻辑结构设计 E-R图向关系模型的转换需要遵循以下原则: 1)实体的转换 一个实体(型)转换为一个关系模式,关系模式的属性就是实体的属性,关系模式的码就是实体的码。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 3逻辑结构设计 E-R图向关系模型的转换需要遵循以下原则: 2)二元联系的转换一对一联系:可以和任何一端实体转换得到的关系模式合并,即在被合并的关系模式中增加与该联系相连的另一端实体的码以及联系本身的属性,合并后的关系模式的码保持不变。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 3逻辑结构设计 2)

30、二元联系的转换一对多联系:可以和n端实体转换得到的关系模式合并,即在n端实体转换得到的关系模式中增加与该联系相连的另一端实体(即1端实体)的码(该属性在合并后的关系模式中还是一个外码)以及联系本身的属性,合并后的关系模式的码保持不变。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 3逻辑结构设计 2)二元联系的转换多对多联系:转换为一个独立的关系模式,关系模式的属性包括与该联系相连的两端实体的码以及联系本身的属性,关系模式的码由这两个实体的码共同组成,在这个独立的关系模式中,它们也都是外码。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 3逻

31、辑结构设计在本系统中,选择关系模型进行逻辑结构设计,根据学生成绩管理系统的E-R图,它们可以转换为以下3个关系模式:学生(学号,姓名,性别,年龄,班级)课程(课程号,课程名,学分,课程简介)选修(学号,课程号,成绩),5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 4物理结构设计物理结构设计是为数据模型选取一个最适合应用环境的物理结构,包括存储结构和存取方法,这依赖于具体的数据库管理系统。物理设计主要包括聚簇设计、索引设计和分区设计。在目前商品化的关系数据库管理系统中,数据库的大部分物理结构都由系统自动完成,用户需要设计的部分已经很少了。,5.4 数据库设计,第5章 数

32、据库技术,5.4.3 数据库设计应用举例 5数据库实施在数据库实施阶段,根据逻辑结构设计和物理结构设计的结果,设计人员用数据库管理系统提供的数据定义语言(如SQL)建立数据库,并编制、调试应用程序,组织数据入库,进行试运行。,5.4 数据库设计,第5章 数据库技术,5.4.3 数据库设计应用举例 6数据库运行和维护数据库试运行合格后,就可以交给用户正式运行了。但由于应用环境的不断变化,对数据库的维护工作将是一项长期任务。在数据库运行阶段,对数据库经常性的维护工作主要由数据库管理员负责完成,包括数据库的转储和恢复、数据的安全性和完整性控制、数据库性能的监督与分析改造、数据库的重组织和重构造。需要

33、指出的是,设计一个完善的数据库应用系统往往需要以上6个阶段的不断反复。,5.4 数据库设计,第5章 数据库技术,5.5 数据仓库和数据挖掘,主要内容 5.5.1 数据仓库 5.5.2 数据挖掘,第5章 数据库技术,5.5.1 数据仓库 1数据仓库的概念目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作Building the Data Warehouse一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time V

34、ariant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。,5.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.1 数据仓库 1数据仓库的概念需求分析根据数据仓库概念的含义,数据仓库拥有以下四个特点: 1)面向主题2)集成的3)相对稳定的4)反映历史变化,5.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.1 数据仓库 2数据仓库框架结构数据仓库提供了

35、一种使信息可用于决策制定的方法。一个有效的数据仓库战略必须能处理现代企业的复杂事件。每个事务处理系统都会产生数据,并且存放在不同的数据库中。用户需要随时随地的访问数据,以满足他们对数据的需求。因此,一个数据仓库必须适应商业模式,而不是支配和改变它。 许多模块构成了数据仓库系统。这个系统从现有的事务处理系统和MIS为基础,一部分为支持数据仓库而设的后台处理,以访问和运用数据仓库内数据的用户而结束。在中间是个分散过程,它使数据以一种局部而不是集中的方式支持用户。至于其他系统,则是覆盖这些处理过程技术的基础,如安全系统,它不仅控制着在终端数据仓库的输入过程,还控制着用户在数据仓库的前台访问能力。,5

36、.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.1 数据仓库 2数据仓库框架结构 数据仓库的框架结构如图所示。,5.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.2 数据挖掘 1数据挖掘的定义数据挖掘也可以称为知识发现(Knowledge Discovery in Database),是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先难以预计的,潜在的有价值信息和知识的过程。 在数据挖掘中发现的知识,并不是崭新的自然科学定理或者数学公式,而是数据之间存在的某一种关联。这种关联对不同的人呈现出完全不同的价值。数据挖掘发现的知识都是基于现实当中产生

37、的数据,在特定前提和约束条件下,面向特定领域的知识。用这样的知识可以指导一定范围内的业务活动。知识的表现也要求易于被用户理解,最好能用自然语言表达所发现的结果。,5.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.2 数据挖掘 2数据挖掘的目标和基本特征为达到这样的商业目标,数据挖掘可以帮助用户处理大量的数据,以期在数据仓库中得到“意外”的发现,这些发现是潜在带来更高利润的顾客,而不是任意的新顾客;这些发现是战略性的和富有竞争性的,对企业的未来有方向性的指引。 企业的数据分析划分为三个不同的层次和范畴。首先要了解企业经营活动中发生了什么?其次,要了解为什么会发生,然后依据原因确定企业可以做

38、什么,不可以做什么。,5.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.2 数据挖掘 2数据挖掘的目标和基本特征下图描述了数据分析的三个层次。传统的查询、报表和多维分析技术主要集中处理发生了什么,但却很少考虑原因。数据发掘的贡献在于支持最高层次的数据分析,并预测可能采取的行动。,5.5 数据仓库和数据挖掘,第5章 数据库技术,5.5.2 数据挖掘 3数据挖掘的过程数据挖掘是一个复杂的过程。数据挖掘充分利用人工智能、机器学习、统计学等多学科的知识,并把他们同其他辅助技术结合到一起,从大量的数据中找出潜在的、有用的知识。数据挖掘的过程如下图所示。,5.5 数据仓库和数据挖掘,第5章 数据库技

39、术,5.5.2 数据挖掘 4数据挖掘技术和工具数据挖掘技术和工具可分为三大类:统计分析或数据分析,知识发现以及其他工具和技术,包括:可视化系统、地理信息系统、分形分析和私有工具。,5.5 数据仓库和数据挖掘,第5章 数据库技术,随着数据库技术的发展,各种高级数据库系统已经出现并在开发中,以适应新的数据库应用需要。近年来在数据库研究与实践两个领域仍在迅速发展,以数据库为基础的信息系统的应用范围也迅速扩展。与此同时,面向工程(CADCAMCIMS)与办公的系统,以及地理信息系统等复杂应用也日益与数据库相结合。这些新的数据库应用包括处理空间数据(如地图)、工程设计数据(如建筑设计、系统部件、集成电路

40、)、超文本和多媒体数据(包括文本、影像、图像和声音数据)、时间相关的数据(如历史数据或股票交易数据)和www(通过因特网可以使巨大的、广泛分布的信息存储)。,5.6 数据库技术的发展,第5章 数据库技术,主要内容 5.1 数据库系统概述 5.2 关系数据库 5.3 SQL语言 5.4 数据库设计 5.5 数据仓库和数据挖掘 5.6 数据库技术的发展,第5章 数据库技术,第5章 数据库技术,讨论,数据库管理系统包括五个重要软件组成部分:数据库管理系统引擎、数据定义、数据处理、应用程序生成与数据管理子系统。对于数据库用户而言,哪一部分是最重要和最不重要的?对于开发数据库应用的技术专家而言,哪一部分是最重要和最不重要的?对于一名首席信息官(CIO)而言,哪一部分是最重要和最不重要的?为每一个答案给出正当的理由。,Thank You!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 网络科技 > 数据库

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报