1、1 数据库原理与应用 黄 晓涛 18071733366 网络与计算中心基础教研室 2 大数据看春运:数据的存储和分析 透过数据可以找出多少亮点? 网络与计算中心基础教研室 3 高考数据分析:数据的存储 数据量 2011年全国 933万,湖北 48.5万 Excel 2010: 列数最多 256列 ,行数最多 65536行 数据库存储 关系数据库,二维表 网络与计算中心基础教研室 4 高考数据分析:数据的存储 假如每个考生的信息如下: 考号、姓名、性别、类别、语文、数学、外语、综合,类别分为文理科 则所有考生的数据就构成一个二维表,如图: 网络与计算中心基础教研室 5 可 SELECT 考号
2、, 类别 , 语文 +数学 +外语 +综合 AS 总分 FROM 高考成绩表 ; 高考数据分析:求每个人的总分 网络与计算中心基础教研室 6 高考数据分析:求出一分一段结果 使用如下命令对上面的表进行统计。 SELECT 总分 , count(*) AS 人数 FROM 高考成绩表 WHERE 类别 =1 GROUP BY 总分 ORDER BY 总分 DESC; 网络与计算中心基础教研室 7 本课教学目标 1.数据库能做什么? Why? 2.什么是数据库 -数据库的基本知识 What? 3.如何使用 SQL Server2008建立数据库 How? 第 1章 数据库系统概述 1.1 信息、数
3、据、数据处理与数据管理 1.2 数据库技术的产生、发展 1.3 数据库系统的组成 1.4 数据库系统的内部体系结构 1.5 数据库系统的外部体系结构 1.6 数据库管理系统( DBMS) 1.7 数据模型 1.8三个世界及其有关概念 1.9 四种数据模型 1.10 数据库系统的发展 1.11 数据库技术与其他相关技术的结合 9 通讯录: 图书馆: 数据库 数据存放的地方 小数据库 可用 手工 管理 大型数据库 必须由 计算机 进行管理 计算机三大主要应用领域? 科学计算 过程控制 数据处理 70% 10 信息的特征 1.1 信息、数据、数据处理与数据管理 1.1.1 数据与信息 信息 能源 物
4、质 客观世界的三大要素 采集并加工、传递 消息 情报 指令 数据 信号 学号: S1 姓名:赵亦 性别:女 年龄: 17岁 所在系别:计算机 源于物质和能量 可以感知 可存储、加工、 传递和再生 11 数据 数据是信息的具体表现形式 数据的表现形式 数据与信息的联系 数据是信息的符号表示或载体 信息是数据的内涵,是对数据的语义解释 S1 赵亦 女 17岁 计算机 数字 文字 图形 图象 声音等 12 1.1.2 数据处理与数据管理 信息数据数据处理 将数据转换成信息 的过程 包括数据的收集、 管理、加工利用 乃至信息输出演变 推导 等 数据的收集、 分类、组织、 编码、存储、 维护、检索、 传
5、输等操作 数据处理 数据管理 产出 输出结果 原料 输入 “数据处理”的真正含义应该是为了产生信息而处理数据 13 网络数据统计结果 14 单击提交按钮后发生了什么? 1.将用户的选择写入已定义好的数据库表中 2.从表中读取数据,分别统计出A,B,C,D 选项所占比例。 3.将统计结果显示在页面上 15 更复杂的一个例子 16 1.1 信息与数据 信息: 1.你是:理工科学生 2.你是否对计算机感兴趣:只是想上网 3.上大学前你的计算机应用程度:会使用一些简单的常用软件比如 office 4.如果在学校网站上有关于教学资料,你会去看吗?:会 5.你认为大学计算机基础教学是为了:应用 数据 1.
6、A 2.B 3.C 4.A 5.A 现实世界 信息世界 计算机世界 17 1.2 数据库技术的产生、发展 人工管理阶段 文件系统阶段 数据库系统阶段 数据不保存,无专用软件管理数据, 不共享,无独立性 数据以文件形式长期保存,由文件系统管理 数据 ,程序与数据间有一定独立性 ,文件的形 式已经多样化 ,数据具有一定的共享性 数据结构化 ,共享性高、冗余度低 , 独立性高 ,有统一的数据控制功能 DBMS 数据的安全性控制、 数据的完整性控制、 并发控制、 数据恢复 18 1.2 数据管理技术的产生、发展 数据管理技术 1. 人工管理阶段 程序与数据是一个整体,一个程序中的数据无法被其他程序使用
7、,因此程序与程序之间存在大量的重复数据。 特点 : 程序之间不能共享数据; 程序复杂; 数据量小且无法长期保存; 人工重复输入数据 ,数据不保存。 19 人事管理应用程序 教师信息数据组 学生管理应用程序 学生信息数据组 教务管理应用程序 课程信息数据组 学生部门 教务部门 人事部门 应用程序和数据的依赖关系 20 1.2 数据管理技术的发展 2. 文件系统阶段 20世纪 50年代后期至 60年代后期 ,计算机 外存储器 有了磁鼓和磁盘等直接存取设备;软件有了操作系统和文件系统;程序通过 数据文件 访问数据。 外存 储器 数据输入程序 数据输入程序 01090101林小辉 1211198012
8、0122长春市东朝阳路 10委 6号 1300210431-789910101090102李晓娜 24101984022923黑龙江省哈尔滨市建设街 5号 1500860431-565465401090103王强 14011984060322长春市民康路 10号 1300240431-987451901090104张丽丽 23101984071122吉林珲春市第二高级中学 1333000440-751886401090105赵海燕 23011984021523黑龙江大庆市萨尔图区 1633110459-637936301090101 林小辉 12111980120122 长春市东朝阳路 10
9、委 6 号 1 3 0 0 2 1 0 4 3 1 - 7 8 9 9 1 0 101090102 李晓娜 24101984022923 黑龙江省哈尔滨市建设街 5 号 1500860431- 565465401090103 王强 1 4 0 1 1 9 8 4 0 6 0 3 2 2 长春市民康路 10 号 1 3 0 0 2 4 0 4 3 1 - 9 8 7 4 5 1 901090104 张丽丽 23101984071122 吉林珲春市第二高级中学 1 3 3 3 0 0 0 4 4 0 - 7 5 1 8 8 6 401090105 赵海燕 23011984021523 黑龙江大庆市
10、萨尔图区 1 6 3 3 1 1 0 4 5 9 - 6 3 7 9 3 6 3数据文件 01090101 林小辉 12111980120122 长春市东朝阳路 10 委 6 号 1 3 0 0 2 1 0 4 3 1 - 7 8 9 9 1 0 101090102 李晓娜 24101984022923 黑龙江省哈尔滨市建设街 5 号 1500860431- 565465401090103 王强 1 4 0 1 1 9 8 4 0 6 0 3 2 2 长沙市五一路 10 号 1 3 0 0 2 4 0 7 3 1 - 4 8 7 4 5 1 901090104 张丽丽 231019840711
11、22 吉林珲春市第二高级中学 1 3 3 3 0 0 0 4 4 0 - 7 5 1 8 8 6 401090105 赵海燕 23011984021523 黑龙江大庆市萨尔图区 1 6 3 3 1 1 0 4 5 9 - 6 3 7 9 3 6 3数据文件 21 外存 储器 01090101林小辉 12111980120122长春市东朝阳路 10委 6号 1300210431-789910101090102李晓娜 24101984022923黑龙江省哈尔滨市建设街 5号 1500860431-565465401090103王强 14011984060322长春市民康路 10号 13002404
12、31-987451901090104张丽丽 23101984071122吉林珲春市第二高级中学 1333000440-751886401090105赵海燕 23011984021523黑龙江大庆市萨尔图区 1633110459-6379363特点 :多个程序 共享 数据;易于 长期保存 数据;程序代码有所简化;数据冗余(重复)度较大;程序对数据依赖性较强;人员专业性较强。 查询程序 王强 长沙市五一路 10号 1300240731-4874519 01090103 查询程序 例如: 数据查询与报表 22 学生部门 教务部门 人事部门 文件系统 教师数据文件 学生数据文件 课程数据文件 人事管理
13、应用程序 学生管理应用程序 教务管理应用程序 图 1-2 应用程序和数据文件的关系 23 文件系统阶段 应用程序与数据间的对应关系 文件 系统 文件 1 文件 2 文件 3 应用程序 1 应用程序 2 应用程序 n ( 3) 数据库系统阶段 : 20世纪 60年代后期开始。 例:学生基本信息记录表 : 学号 姓名 性别 出生年月 学院 籍贯 奖惩情况 200505101 张三 男 1987/10/10 经济学院 广东 2005-06学年一等奖学金 2005-06学年校三好学生 200505102 李四 男 1988/01/10 经济学院 河南 200505103 钱红 女 1987/05/21
14、 经济学院 上海 200505106 赵晓林 女 1989/02/10 经济学院 上海 2005-06学年一等奖学金 这个表格的缺点:有些同学的奖惩记录很多,但大部分没有,因此“奖惩情况”这一栏该留多大的位置很难确定。而且很难统计奖励的次数 修改后的记录表:将学生基本信息和奖惩情况分开来 学号 奖惩情况 200505101 2005-06学年一等奖学金 200505101 2005-06学年校三好学生 200505106 2005-06学年一等奖学金 学号 姓名 性别 出生年月 学院 籍贯 200505101 张三 男 1987/10/10 计信学院 广东 200505102 李四 男 198
15、8/01/10 计信学院 河南 200505103 钱红 女 1987/05/21 计信学院 上海 200505106 赵晓林 女 1989/02/10 计信学院 上海 . 奖惩情况表 修改后的学生基本信息记录表 特点:描述数据时不仅描述数据本身,还描述了数据间的联系。 特点: a、数据结构化,信息完整,功能通用。 b、实现 数据共享 , 减少 数据 冗余 ,易扩充。 c、采用了 特定的数据模型 。 d、 数据独立性高 物理独立性 :应用程序的处理与数据物理结构无关。 逻辑独立性 :数据的逻辑结构的改变,用户程序可以不改变。 ( 3) 数据库系统阶段 e、数据由 DBMS统一管理和控制。 返回
16、 应用程序 1 应用程序 2 应用程序 N 数据库管理系统 DBMS 数据库 图 1-4数据库系统阶段应用程序与数据的关系 28 数据库系统阶段 程序与数据间的对应关系 应用程序 1 应用程序 2 应用程序 n 数 据 库 数据库 管理系统 DBMS 举一个数据库系统的例子 (与社会学有关的) 说明:功能、 DBMS、用户、硬件、操作系统 作业: 人工管理阶段 文件系统阶段 数据库系统阶段 背 景 特 点 数据的结构化 无结构 数据管理技术 三个发展阶段的详细比较 应用背景 科学计算 科学计算、管理 大规模管理 硬件背景 无直接存取存储设备 磁盘、磁鼓 大容量磁盘 软件背景 没有操作系统 有文件系统 有 DBMS 处理方式 批处理 实时处理 数据的管理者 用户(程序员) 文件系统 数据库管理系统 数据面向的对象 某一应用程序 某一应用 现实世界 数据的共享程度 无共享,冗余度很大 共享性差,冗余度大 共享性高,冗余度小 独立性差 实时处理、分布处理、批处理 具有高度的物理独立性和一定的逻辑独立性 数据的独立性 不独立,完全依靠于程序 记录内有结构、整体无结构 整体结构化,用数据模型描述 数据控制能力 应用程序自己控制 文件系统 数据库管理系统