1、迟嘉昱 13725303912 ,管理信息系统,第五章 数据资源管理,1. 数据资源管理 基本概念 信息世界和机器世界 数据库的类型 传统的文件处理 数据库管理方法2.数据库管理技术基础 数据库结构 数据库开发,第一节 数据资源管理,大量的数据,基本概念,数据资源管理 应用数据库管理、数据仓库等信息系统技术和其他数据管理工具,完成组织数据资源管理任务,满足企业股东信息需求的管理活动。,基本概念,数据(Data) 未经加工的事实或观察资料; 描述事物的符号记录; 例: 数据的语法即数据的格式规定 数据的语义即数据的含义 人们通过解释、推论、归纳、分析、综合等方法从数据中获得的有意义的内容即为信息
2、,基本概念,数据库(DataBase) 是长期储存在计算机内的、有组织的、可共享的数据的集合。 例子:,基本概念,数据库管理系统 DBMS - DataBase Management System 处理数据库访问的软件。 提供数据库的用户接口。DBMS的目的: 提供一个可以方便地、有效地存取数据库信息的环境。 例子:Oracle, DB2, SQL Server, SybaseAccess, Interbase, MySQL,基本概念,数据库系统是指在计算机系统中引入数据库后的系统,数据库系统构成,信息世界和机器世界,现实世界存在于人们头脑之外的客观世界。信息世界信息世界是现实世界在人们头脑中
3、的反映,人们把它用文字和符号记载下来。,信息世界中的术语 1)实体:客观存在的可以相互区别的东西。 注:可以是具体的对象,也可以是抽象的事件;2)实体集:性质相同的同类实体的集合;3)属性:实体的每一个特性;4)实体的键/码(Key):能唯一标识每个实体的属性或属性集。,信息世界和机器世界,信息世界中的术语(续) 5)联系(Relation)(1)一对一联系; (2)一对多联系;(3)多对多联系。,信息世界和机器世界,实体和其相互关系,机器世界信息经过加工编码进入机器世界,信息世界的信息在机器世界中是以数据的形式存储的。,信息世界和机器世界,机器世界中的术语: 1)字段:标记实体属性的命名单位
4、称为字段,或数据项;它是可以命名的最小信息单位。字段的名称往往和属性名相同。2)记录:字段的有序集合称为记录。一般用一个记录描述实体,所以记录又可以定义为能完整地描述一个实体的字段集。例如: 学生(990001,王军,20,男,电子商务),信息世界和机器世界,机器世界中的术语(续) 3)文件:同一类记录的集合称为文件;文件是描述实体集的,所以它又可以定义为描述一个实体集的所有记录集。4)记录的键:能唯一标识文件中每个记录的字段或字段集。,信息世界和机器世界,术语的对应关系:,信息世界和机器世界,三个世界的关系:,信息世界和机器世界,现实世界,信息世界(概念模型,如ER图),机器世界(DBMS支
5、持的数据模型),收集、分类和抽象,加工转化,逻辑数据元素,字符:一个简单的字母,或是一个数字,或是一个其他符号。 字段(数据项):标记实体属性的命名单位,由一组相关字符构成。 记录:描述一个实体的属性集,是字段的有序集合。 文件:一组相关(同一类)记录的集合,用于描述实体集。 数据库:存储在组织计算机中的逻辑相关的所有数据元素的集合。,逻辑数据元素,逻辑数据元素,数据库类型,数据库类型,运营数据库存储支持业务流程和企业运营的详细数据。如:客户数据库、人力资源数据库、库存数据库以及存储企业运营数据的其他数据库。分布式数据库在各种网络上将数据库的全部或部分复制、分发到不同的网络服务器上。对终端用户
6、来说,复制、分享数据库可以提高数据库的性能。但如何确保组织内分布式数据库中所有数据的一致性和并发性是分布式数据库管理面临的挑战。,数据库类型,外部数据库由在线商业服务公司提供的收费数据库。WWW资源也属于外部数据库。超媒体数据库Web站点上存储的超链接多媒体页面(包括文本、图形、图片、视频素材和音频片段等)。,超媒体数据库,数据仓库,存储着从各种运营数据库、外部数据库及其他组织数据库中提取的数据。 是企业核心的数据资源。 其中的数据已经过清洗、转换和分类,便于管理者及其他专业人士进行数据挖掘、联机分析处理,便于进行各类业务分析、市场研究和决策支持,但不能被变更。,数据仓库系统,数据集市,定义:
7、 是数据仓库中关于企业某一方面的数据子集,如针对某一部门或针对某一业务流程。,数据仓库与数据集市,数据挖掘,定义: 利用各种先进的模式识别算法和数学、统计技术分析数据仓库中的数据,揭示已经发生的业务活动中隐含的关系、模式和趋势,并从中推出规则,帮助管理者预测未来的行为和制定决策。,数据挖掘,进行购物篮分析,识别新产品的捆绑销售机会(啤酒+尿布)。 防止客户流失并争取新客户。 发现质量和生产问题的根本原因。 对现有客户进行交叉销售。 建立更准确的客户特征及偏好信息。,传统的文件处理,定义: 用彼此独立的数据文件来组织、存储和处理数据。,银行文件处理系统,传统的文件处理的问题,数据冗余:数据的重复
8、,即同一数据(如客户姓名和地址)存储在很多个不同的文件中。 数据的不一致性:相同的项目,比如客户的电话和地址,更新时需要多处进行修改。如果发现错误,两个值不相同,则很难确定哪个值是正确的。 缺少数据集成:为从每个独立的文件中提取数据,我们必须编写特定的计算机程序。 程序和数据的依赖:在文件处理系统中,系统的主要构成部分物理存储设备上的组织文件和访问这些文件的应用软件彼此高度依赖。 数据的安全性和完备性差,数据库管理方法,定义: 将原先存储在各个独立文件中的数据记录合并到一个数据库中,供很多不同的应用程序访问。,银行信息系统中的数据库管理方法,数据库管理软件(DBMS),定义: 数据库管理系统是
9、数据库管理方法的主要软件工具。它是存储数据库结构、数据、数据库中数据之间关系和与数据库相关的报表和报告的软件。 DBMS是用户和数据库之间的软件界面,可以帮助用户轻松访问数据库中的数据,是控制着组织及其终端用户对数据库的创建、维护和使用。,DBMS的主要功能,数据库的定义; 数据库的维护; 数据库的查询; 数据库的过程性/非过程性访问; 应用程序开发; 事务处理。,DBMS的主要功能,数据库管理系统的优点,减少数据冗余。 保证数据独立性 从多个文件中集成数据 快速检索数据和信息 改进安全控制。,数据库管理系统的缺点,需要昂贵的软件 需要较高的硬件配置 雇用和留住DBA人员。,数据库查询,定义:
10、 终端用户可以使用DBMS的查询特性或报告生成器在数据库中查找信息。 查询语言只需输入一个简短的查询语句,你的特殊数据需求就会立刻得到响应。 报告生成器你可以快速指定报告的格式,以报告的形式提供信息。,自然语言和SQL查询,数据库维护,组织数据库需要不断更新,以反映最新的企业事务和其他事件。 进行数据的更新或改正,以保证数据库中数据的准确性。,应用开发,很多DBMS软件包都提供内嵌的第四代编程语言和软件开发工具,终端用户、系统分析员及其他应用开发人员可以使用它们来开发客户化的应用程序。,第二节 数据库管理技术,数据库结构,层次结构记录间的关系呈现为层次或树状结构。,数据库结构,网状结构可以沿多
11、条路径访问同一数据元素,因为任何一个数据元素或记录可以同多个其他数据元素发生关系。,数据库结构,关系结构数据库中所有数据元素都以简单的表的形式存在。,数据库结构,多维数据库结构 使用多维结构来组织和表示数据间的关系。,多维数据库,面向对象的数据库结构,面向对象的数据模型比其他数据库结构更易处理复杂的数据类型(如图形、图片、声音和文本)。 封装将描述实体属性的数据值与数据上可以执行的操作作为一个对象。 继承通过复制一个或多个父对象的一些或全部特性,自动生成新对象。,继承,数据库结构评价,对企业运营存在的很多结构化、常规事务处理来说,层次模型是一种自然的数据库模型。 网状数据结构可以轻松地处理多对
12、多关系。 关系型数据库允许终端用户根据特定的需求轻松地从数据库中检索信息。,数据库结构评价,数据库开发,大型组织通常将企业级数据库开发的控制权交给数据库管理员(DBA) 数据字典:一个包含元数据的数据库管理目录。 元数据:关于数据的数据。,数据库开发流程,数据规划,数据库管理员、数据库设计人员要与企业、终端用户一起建立企业模型,定义企业基本的业务流程。,数据建模,定义: 识别数据元素间关系。 定义支持某项基本业务流程所需要的数据元素间的关系。,实体关系图(E-R图),最常用的概念模型表示方法,实体关系图(E-R图),E-R信息模型的设计与应用,E-R图设计原则: 真实性原则 避免冗余原则 简单
13、性原则 合适性原则(用实体或属性或联系集) 注意对客观对象的约束 映射约束、键码约束、参照完整性约束,E-R信息模型的设计与应用,实体(Entity): 是一个有着一系列显著的、易辨认的属性的对象。 实体可以是具体的(物体、人物等。) 实体也可以抽象的(事、概念、事物之间的联系) 确定实体的指导 找出问题中的大模块 问题陈述中的名词,E-R信息模型的设计与应用,属性(Attribute) 实体的特性,它描述了实体的一个部分。 一个实体可由若干个属性来刻画。 如学生(学号,姓名,性别,) 码(Key): 唯一标识实体的属性集。 如:学号为学生的码。 确定属性的指导 可能将名词当作属性,但不应将其
14、和实体混淆。,E-R信息模型的设计与应用,E-R图绘制,E-R图绘制,E-R信息模型的设计与应用,E-R信息模型的设计与应用,E-R图向关系数据模型的转换 E-R图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。 对于“联系集”,根据联系方式不同,采取不同手段以使被它联系的实体所对应的关系彼此实现某种联系。,ER图向关系数据模型的转换,E-R信息模型的设计与应用,将E-R图转换成相应的表 表是行和列的集合,实体被表示成表的形式。 用列标题表示实体的属性。 用行表示关于实体的实际数据。,E-R信息模型的设计与应用,关于表和属性的命名规则 属性名和表名中不能包
15、含空格 表名对实体的描述应该是有意义的。 如:student 表名只能描述一个主题,E-R信息模型的设计与应用,转换举例一,E-R信息模型的设计与应用,转换举例二,E-R信息模型的设计与应用,转换举例三,逻辑和物理视图,逻辑视图数据库中数据及数据间关系; 物理视图描述了计算机系统的物理存储设备上如何存储和存取数据。,逻辑和物理视图,ANSI/SPARC三级模式结构,美国国家标准学会/标准计划和要求委员会,模式(concept schema) 模式是对全体逻辑数据结构的描述,是所有用户的公共数据视图,模式又称逻辑模式或概念模式;外模式(external schema) 外模式是对局部逻辑数据结构
16、的描述,是数据库用户的数据视图,外模式又称子模式(subschema)或用户模式;,ANSI/SPARC三级模式结构,内模式(internal schema) 内模式是对数据物理存储结构的描述,内模式又称物理模式或存储模式2级映射与数据独立性 外模式模式:保证逻辑数据独立性 模式内模式:保证物理数据独立性,ANSI/SPARC三级模式结构,ANSI/SPARC三级模式结构,数据结构 逻辑结构 数据之间存在的逻辑关系 表、树、图、数组 物理结构 数据在计算机内的存储方式 顺序方式、链接方式,ANSI/SPARC三级模式结构,数据独立性 当数据的结构发生变化时,通过系统提供的映象(转换)功能,使应用程序不必改变 数据的物理独立性 当数据的存储结构改变时,应用程序不必改变 数据的逻辑独立性 当数据的逻辑结构改变时,应用程序不必改变,ANSI/SPARC三级模式结构,外模式/模式映象 定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中 当模式改变时,修改外模式/模式映象,使外模式保持不变,从而应用程序可以保持不变,称为数据的逻辑独立性模式/内模式映象 定义数据逻辑结构与存储结构之间的对应关系 存储结构改变时,修改模式/内模式映象,使模式保持不变,从而应用程序可以保持不变,称为数据的物理独立性,