1、1大学信息技术基础复习提纲一、命题框架:类别: 内容: 分值: 说明:1 信息技术理论知识 个选择题2 文字录入 分钟录入个汉字3 基本操作题 22 Windows2000 个操作题 分 多媒体技术 个操作题 分 计算机网络 个操作题 分 计算机安全技术个操作题 分4 Word2000 8 从命题范围中选个知识点5 PowerPoint2000 6 从命题范围中选个知识点6 Access2000 9 从命题范围中选个知识点(其中建表为必考占分)二、 大学信息技术基础复习提纲知识点 1:信息的定义与度量香农对信息的定义:信息是有秩序的量度,是人们对事物了解的不确定性的消除或减少。香农对信息科学的
2、主要贡献是创立了狭义信息论。信息论的创始人:香农 逻辑代数创始人:布尔 控制论创始人:维纳信息论发展的三个阶段:狭义(经典)信息论,一般信息论,广义信息论。掌握自信息量与信息熵的度量公式,并会计算自信息量:I(x)log 2(1/p(x)) - log 2 p(x)例 1:等概率地掷一个骰子,获得某一面朝上的自信息量是 -log2 1/6例 2:实验指导书第 131 页第 2 题。信息熵:H P 1log2P1 + P2log2P2 + Pnlog2Pn 例 3:如甲地共有 8 种状态,如果甲处 4 种状态的概率全为 0,其余 4 种状态各为 1/4。这时甲传给乙的信息熵是 2,即 H= P1
3、log2P1 + P2log2P2 + Pnlog2Pn =-1/4 log21/4+1/4 log21/4+1/4 log21/4+1/4 log21/4=- log21/4=2理解数据、消息、信号与信息的区别信息是包含在消息中的抽象量,消息是具体的,其中包含着信息数据是末加工的信息,信号中带着消息,是数据的脉冲编码知识点 2:信息技术、信息科学与计算科学信息技术的定义及理解信息技术是人类开发和利用信息资源的所有手段的总和;是一个综合的技术,与我们生活密切相关,如:手机。四次信息技术革命: 第一次革命:人类创造了语言和文字,接着现出了文献。 第二次革命:造纸和印刷术的出现。 第三次革命:电报
4、、电话、电视及其他通讯技术的发明和应用。第四次革命:电子计算机和现代通讯技术在信息工作中的应用。 信息技术对人类信息器官的扩展对应关系2计算机技术人的思维器官处理信息和决策的功能的扩展微电子技术扩展了人对信息的控制和使用能力通信技术扩展人的神经系统传递信息的功能传感技术扩展人的感觉器官收集信息的功能信息技术的核心技术:计算机技术、微电子技术、通信技术、传感技术信息科学的研究对象与研究范围:以信息为基本研究对象,以信息的运动规律和应用方法为主要研究内容理解计算的一般定义:计算就是符号串的变换过程图灵机的组成及其意义:图灵机只是理论模型,不是实际的机器。图灵论题:凡可计算的函数都可用一台图灵机来实
5、现计算作为一门学科报告中对计算科学作的定义:见教材第 18页。计算学科中根本问题是“能行问题”什么问题能够被有效地自动地处理。计算机科学研究的领域知识点 3:计算机中的信息表示二进制的特点与基本运算:特点:容易表示,运算简单信息的编码(ASCII 码和中文信息编码)ASCII码是 7 位的二进制编码,表示 128 个字符,用 一个字节表示,最高位为 0。ASCII 码是对英文字母、数字和特殊字符的编码常用 ASCII 对应关系: A65 a97 048汉字信息处理:输入码-交换码-内部码-字形码输入码:五笔输入码,拼音输入码等国标码(如 GB2312-80)与内码都是用两个字节表示一个汉字,国
6、标码两个字节的最高位为0,内码两个字节的最高位为 1。转换公式:国标码+8080H=内码数制及其转换:数制转换可用计算器实现数基的概念:基数(Base):一个数制所包含的数字符号的个数二进制与十进制的相互转换二进制与十六进制的相互转换掌握不同进制间的转换:如十、二、八、十六进制间的转换,找出最大值或最小值,常用方法是转换为同一进制后再比较。例如:实验指导书第 126页第 3题。理解基本逻辑运算(与、或、非、异或)A与 B:只有 A和 B同时为真时结果为真,否则为假A或 B:只要其中之一为真时结果为真,否则为假非 A:若 A为假,则结果为真,否则为假A异或 B:只有 A和 B取值不同时为真,否则
7、为假知识点 4:计算机发展史与基本原理计算机发展史第一台计算机:1946 年,美国,ENIAC冯诺依曼型计算机的工作原理:程序与数据存储和程序控制现代计算机发展的四个阶段(采用的基本器件,注意时间段)第一代(19461957):电子管 ,机器语言第二代(19581964):晶体管,高级语言第三代(19651970):集成电路的发明,操作系统第四代(1970 年至今):超大规模集成电路,个人计算机(PC)的发明,计算机网络3计算机智能及图灵测验智能计算机是一种有知识、会学习、能推理的计算机。“图灵测试”也有其局限性,尤其对创造性以及理解性的问题缺乏充分的估计。所以说,若某台电脑通过了“图灵测试”
8、 ,则并不能确定这台计算机具备真正的智能。1997 年,IBM 旗下一台名为“深蓝” (Deep Blue)的“计算机棋手”在与人类的“国际象棋”对弈中,第一次战胜了国际象棋世界冠军卡斯帕罗夫。微型计算机的基本结构:存储器,运算器,控制器,输入设备,输出设备知识点 5:微型计算机硬件系统一个完整的计算机系统应包括:硬件系统和软件系统CPU的概念及组成CPU(微处理器):主要由运算器、控制器、寄存器组成,主要参数:字长和主频主板及总线的概念主板(Mainboard)是微机系统中最大的一块电路板。总线(BUS)是计算机内部传输指令、数据和各种控制信息的高速通道总线分为:数据总线、控制总线和地址总线
9、若地址总线宽度为 16位,则可寻址的内存单元是 216=65536 字节。内存储器的寻址及分类内存是 CPU可以直接访问的存储器CPU的寻址范围由地址线的多少来决定例 1:如果计算机有 32 根地址线,寻址范围为 232Byte=4GB。地址编号为:00000000H FFFFFFFFH。例 2:若地址区间为 3000H 至 6FFFH,则能表示 6FFFH-3000H+1Byte=16KB内存储器分为随机存储器(RAM)和只读存储器(ROM)两类。RAM在断电后信息全部丢失。ROM的共性:数据具有非易失性(断电信息不丢失)和数据不可随意改变。如 BOIS外存储器(硬盘、软盘、光盘的特点)软盘
10、、硬盘、光盘、USB 盘等存储器都是 CPU不能直接访问的存储器,需要经过内存以及I/O设备交换信息,统称外部存储器。外部存储器具有永久保存信息的特点。USB 盘(即 U 盘)是采用闪存(Flash ROM)作为存储介质常用的输入设备及工作原理常用的输入设备:鼠标,键盘,扫描仪,触摸屏,输入笔,数码相机其中:数码相机、数字摄像机、扫描仪都是采用 CCD(电荷耦合器件)的设备常用的输出设备及工作原理常用的输出设备:显示器(VGA、CRT、LCD) ,打印机,绘图仪磁盘驱动器和 Modem(调制解调器)既是输入设备 也是输出设备调制解调器(Modem)的功能是实现模拟信号与数据信号的相互转换计算机
11、的总线及标准常见的总线有 ISA(工业标准体系接口)总线、PCI(外部设备互连)总线、SCSI(小型计算机系统接口)总线计算机与外部设备的接口及标准(串口、并口及 USB接口)数据的传输方式基本分为两种:串口和并口串口:一种是用一条线(或一对线)用来传送数据,这种叫串行传输接口(最早出现的串行接口标准是 RS232标准) 。特点:传输稳定、可靠、传输距离长。但数据传输速率较低。并口:一种是用几条线来同时传送数据,这种叫并行传输接口。 特点:数据传输速率较大,协议简单、易于操作。但易受到干扰,传输距离短,数据易丢失。4USB( Universal Serial Bus)是一种通用串行总线接口,支
12、持即插即用知识点 6:计算机软件系统的基本概念计算机软件分为系统软件和应用软件,计算机软件在使用中不会磨损,硬件会磨损计算机软件的定义及性质软件定义:计算机软件是在计算机上运行的各种程序、要处理的各类数据以及有关文档的总称。软件技术的发展及重要事件计算机语言的发展:机器语言-汇编语言-高级语言(FROTRAN,PASCAL,C,BASIC)计算机能直接识别的语言只能是机器语言1956年FORTRAN 语言(美国 巴科斯)20世纪 60年代Pascal、COBOL 语言(软件危机)1971年C 语言(美国 贝尔实验室)1975年Basic 微电脑软件(美国 比尔.盖茨、保罗.艾伦)1991 年出
13、现 Linux 操作系统,它是一种“开放源件软件” ,可直接使用,不存在侵权。1995年微软的第一个混合 16/32位操作系统 Windows 95问世21世纪的软件技术:为了提高软件开发效率,实现软件复用,提出“基于构件”的一种开发技术软件系统的分类按照计算机软件分类与代码的国家标准,软件可分为:系统软件、支持软件与应用软件系统软件:操作系统、目录服务软件、网络系统软件应用软件:字处理软件、绘图软件等支持软件:编译程序、软件开发工具等操作系统的三个特性(并发性、共享性、异步性)操作系统的分类单用户单任务:MS DOS多用户多任务:UNIX,Linux单用户多任务:Windows 98/XP/
14、2000, Mac OS 网络操作系统:Unix,Netware,Windows NT个人计算机主要采用 Windows 98/2000/NT操作系统,但要根据微软在网上发布的消息,经常(或定时)安装补丁程序修补系统安全漏洞的程序。应用软件的概念及分类应用软件:用于解决各种不同具体应用问题的专门软件。常用的应用软件:科学和工程计算软件、字表处理软件、图形图像处理软件、网络应用软件、应用数据库系统。知识点 7:操作系统的功能处理器管理中断的概念:中断是指 CPU对系统发生的某个事件做出的一种反应。进程的概念与三种状态进程是指 CPU的分配和执行的基本单位进程的三种状态:执行态:当前进程已分配到
15、CPU,它的程序正在处理机上运行;就绪态:进行忆具备运行条件,但因为期货进程正占用 CPU,所以暂时不能运行而等待分配 CPU。这时的状态是就绪态。5等待态:因等待某件事件发生而暂时不能运行的状态。进程与线程的关系线程是指进程内的一条执行线路,或者说是进程中可执行代码的单独单元,一个线程只能属于一个进程,而一个进程可以有多个线程,但至少有一个线程,即主线程。存储管理:管理计算机的内存和外存存储管理的功能:存储分配、存储共享、存储保护、存储扩充 多级存储结构(高速缓存、RAM、虚拟存储)高速缓存:处理 CPU 运算速度与内存读写速度不匹配的问题。虚拟存储:逻辑上扩充了内存容量,是利用硬盘的存储空
16、间实现的设备管理设备管理的主要任务与设备的标识设备管理的主要任务是控制外部设备与 CPU间的 I/O操作文件管理文件与文件系统文件是在逻辑上具有完整意义的并赋有名称的信息集合体。文件系统就是操作系统中负责操作和管理文件的一整套设施,它实现的建立、读写、修改、共享和保护等操作,还负责完成对文件的按名存取和进行存取控制。文件夹与目录结构凡是能保存文件的均是文件夹。操作系统文件的逻辑组织结构是采用层次(或树型)目录结构,见教材第 72页图 2-63。知识点 8:多媒体的基本概念媒体的分类与理解感觉媒体:指直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体。如:语言、音乐、自然界的各种声音、各种图
17、形、动画或文本等。表示媒体:指为了传送感觉媒体而人为研究出来的媒体。借助这种媒体能更有效的存储感觉媒体或将感觉媒体从一个地方传送到遥远的另一个地方。如图像编码、语言编码、电报码、条形码等。显示媒体:指用于通信中使电信号和感觉媒体之间产生转换的媒体。如:输入输出设备、键盘、鼠标器、显示器、打印机等。存储媒体:指用于存放某种媒体的媒体,如纸张、磁盘、光盘等。传输媒体:指用于传输某种媒体的媒体。如电话线、电缆、光纤等。多媒体的概念多媒体:通常人们将文本、音频、视频、图形、图像、动画的综合体统称为“多媒体” 。多媒体计算机的组成多媒体计算机硬件系统、多媒体软件系统、多媒体 API、多媒体创作工具及软件
18、、多媒体应用系统若要语音输入或输出,必须要有声卡;若要看电视或接摄像机,则必须有视频卡设备。 光盘存储器的特点记录密度高、存储容量大、采用非接触方式读/写信息、信息保存时间长、多种媒体融合、价格低廉光盘的三种类型及其特点只读型:VCD,CD-DA,CD-ROM,DVD-ROM 只能读出不能修改一次写型:CD-R,DVD-R 只能写入一次,一旦写入不能修改多次写型:CD-RW,DVD-RW,DVD-RAM 多次写入与修改CD-DA,CD-R,VCD,DVD的应用领域6CD-DA标准:用于存储数字化高保真立体声音乐CD-ROM标准:用于发行多媒体节目CD-R标准:用于刻录VCD 标准:采用 MPE
19、G-1 压缩编码标准DVD标准:采用 MPEG-2压缩编码标准CD-ROM,CD-R,CD-RW信息的记录与读取原理磁盘系统的存储是通过改变存储单元的磁场来存储信息,光盘系统利用激光束改变存储单元的物理性质来存储信息,基于物理学的光反射原理来读取信息。CD-ROM(金属压模):在盘上用金属压模压制出的凹坑来存储信息CD-R(有机染料):有机染料被激光束回执熔化后形成凹坑来存储信息CD-RW(结晶层):通过激光照射结晶层呈现结晶与非结晶状态来存储信息知识点 9:多媒体音频与视频处理模拟音频信号参数(频率,周期,幅度)振幅 A 反映了信号的强度,对于声音信号来说,就是声音的大小;频率 f 反映了振
20、动的快慢,对于声音来说, f的大小就反映了音调的高低,频率 f是每秒振动次数,它与周期 T互为倒数:f=1/T。频率的单位为“赫兹” (Hz) 。模拟信号的数字化过程音频数字化过程:第一步采样,第二步量化,第三步编码音频采样是将模拟量在时间轴上进行分割,转化离散的信号。常见数字音频的格式WAV文件,VOC 文件,MPEG(MP3)文件,RealAudio(RM)文件,AIFF 文件。视频的概念与分类视频是运动的图像视频分类:模拟视频,如电视信号;数字视频,如 VCD,DVD,DV电视信号制式电视信号制式:指的是电视播放的一些特点的格式,它包括视频播放的速度,清晰度以及伴音的情况等多个因素。NT
21、SC 制:1953 年由美国创立,日本、加拿大等国相继采用;PAL 制:1967 年由西德创立, 中国、英国、意大利等西欧国家以及北欧各国也都采用它;SECAM 制:1967 年由法国创立,苏联和东欧各国也都采用它。彩色模型YUV模型(PAL 电视制式中采用):Y表示亮度,UV 用来表示色差,它的亮度信号(Y)和色度信号(U、V)是相互独立的。RGB 模型:用 R,G ,B 表示红,绿,蓝三个彩色分量的值, R,G,B 都是 8 位的,在 0255 的区间内量化取值。其他颜色都是由这些基色组成。如 R 和 G 混合是黄色。对视频采样格式的理解视频的数字化过程:采样,量化,编码数字视频的采样:对
22、信号的色差分量的采样频率低于对亮度分量的采样频率,有三种格式: 4:1:1 4:2:2 4:4:4知识点 10: 多媒体图像信息处理图像处理的概念图像的数字化,图像变换,图像编码压缩,图像增强和重构,图像分割,图像识别图像的数字化过程7图像数字化过程:第一步采样,第二步量化,第三步编码图像采样是在二维空间上进行分割,将模拟的连续信息转化离散的数值。采样精度与图像的像素多少有关。图像信息压缩的概念与分类压缩编码的理论基础:信息论。 可压缩原因:原始信源的数据存在着很大的冗余度。数据压缩分类:有损压缩(熵压缩法):如哈夫曼编码、算术编码无损压缩(冗余压缩法或熵编码法):预测编码等经典压缩编码方法:
23、预测编码,交换编码,统计编码矢量图与位图的特点与区别矢量图:使用直线和曲线来描述图形。矢量图形文件容量一般较小,最大的优点是无论放大、缩小或旋转等不会失真,最大的缺点是难以表现色彩层次丰富的逼真图像效果,由于显示时重新计算所以显示速度慢。位图图像,亦称为点阵图像或绘制图像,是由称作像素(图片元素)的单个点组成的。放大、缩小位图尺寸会使原图变形,文件空间较大,显示速度较快,可表现色彩层次丰富的图像。同样一幅图像,颜色数越多占用空间越大,如 256 色比 16 色占用空间大。图形与图像的区别与联系图形是由计算机软件生成或数学公式计算生成(形状、大小及色彩) 。图像是一种模拟信号(像素点的色彩、灰度
24、) 。知识点 11:程序设计算法与程序设计语言算法的基本概念(算法的形式化表示不作要求)算法是求解问题的方法和步骤算法的特性0 个或多个输入,一个或多个输出,确定性(即每个步骤必须有确切的含义) ,有穷性(即执行步骤是有限的) ,有效性(即每个步骤必须是可执行的)算法的表示:自然语言,流程图,N-S 图,伪代码,计算机程序设计语言流程图,N-S 图和伪码表示的简单算法读入正整数 m,n 读入正整数 m,nm mod n r m r当 r0 反复做 n m, r nn m, r n m mod n rm mod n r 直到 r=0 时止输出最大公因子 n 输出最大公因子 n顺序结构,由两个或多
25、个矩形框组成。其中 A 和 B 可以是基本操作,也可以是其它基本结构(如选择结构,循环结构) 。选择结构,当条件 P 成立时执行操作 A,否则执行操作 B。当型循环结构。当条件 P 成立时反复执行操作 A,直到条件 P 不成立时止。直到型循环结构。反复执行操作 A,直到条件 P 成立时止。T FPA BAB当 PAA直到 P8(a)当型循环结构实现 (b)直到型循环结构实现欧几里德算法的 N-S 图表示掌握运算过程:例如:实验指导书第 137 页第 24 题。算法的设计与评价:正确性,可读性,健壮性,高效性,程序的特征(教材 P116)程序:在低级语言中,程序表现为一组指令和有关数据;在高级语
26、言中,程序一般表现为一组说明和语句用程序求解问题的一般过程(教材 P116)明确问题要求,建立数学模型,算法设计,编写程序,调试程序,运行及结果分析程序设计语言的基本功能引入标识符、记住某些值、执行一些运算、进行信息传输机器语言、汇编语言的特点面向机器、移植性差、不易阅读、易出错面向过程语言的特点面向过程、与具体的机器无关、移植性好、易阅读、易排错,如 Fortran,Basic,Pascal,C面向对象的语言的特点,如:C+,Delphi可视化语言的特点,如:Visual Basic ,Visual Foxpro, Visual C+,Java总之,程序设计语言的发展趋势是向模块化、形式化、
27、并行化、可视化、简明化的方向发展。知识点 12: 程序设计语言提供的类型与设施简单类型、结构类型与指针类型简单类型:整型、实型、布尔型(逻辑型:真和假) 、字符型、枚举型、子界型等结构类型:数组(用于保存多个同类型的数据) 、字符串、记录、结构体、文件、日期等基本语句、选择结构语句(if) 、循环结构语句(while,for)的概念编译方式的基本概念(编译方式的翻译过程不作要求)源程序经编译程序编译成目标程序,再由 链接程序 链接生成可执行程序后执行。编译执行方式生成目标代码执行效率很高。解释方式的基本概念边解释边执行,逐句进行,源程序经 解释后得不到目标程序,执行效率不如编译方式。程序设计方
28、法程序设计方法三个原则:抽象原则,枚举原则,归纳原则结构化程序设计结构化程序设计采用的三种基本结构是:顺序结构、选择结构、循环结构结构化程序设计的实现方法:自顶向下,逐步求精细化的分析设计方法分而治之的分割划分技术模块化的组织结构形式知识点 13:软件工程与面向对象方法软件工程方法与面向对象方法软件工程开发模式:瀑布式模型,螺旋式模型,面向对象生存期模型,过程开发模型面向对象方法:模拟自然界认识和处理事物的方法。瀑布式开发模型的三个阶段软件定义时期:问题定义阶段,可行性研究阶段,需求分析阶段软件开发时期:总体设计阶段,详细设计阶段,编码与单元测试阶段,综合测试阶段9软件维护时期:软件的运行和维
29、护阶段面向对象开发模型的五个阶段面向对象分析、面向对象设计、面向对象编程、面向对象测试、面向对象维护面向对象程序设计的特点封装性:将对象的属性和操作封装成一个整体继承性:例如:若父类是交通工具,则继承的子类可以是:轮船、汽车、飞机多态性:多态性是指同一个消息被不同对象接收时产生不同的结果。对象、类、消息、继承的概念对象(Object)将数据和对数据的操作方法 放在一起,形成一个相对独立的整体。类(Class)对同类型对象抽象出共性形成类。如:助教、讲师、教授构成一个教师类。对象是所属类的一个具体实现。称为类的实例。对象之间通过消息(Message )进行通信封装与多态性的概念知识点 14:程序
30、的调试与数据结构常用的三种调试技术输出存储器内容,即:输入边界数据,检查输出结果在程序中插入打印语句,即:查看关键变量的值借助调试工具分析与推断程序错误的五个调试策略试探法、回溯法、对分查找法、归纳法、演绎法黑盒测试法黑盒子测试又称为功能测试或数据驱动测试,把系统看成一个黑盒子,不考虑程序的内在逻辑,只根据需求规格说明书的要求来检查程序的功能是否符合它的功能说明 例如:输入某一数据,检查输出结果,判断它的功能是否符合要求。白盒测试法白盒子测试又称为结构测试和逻辑驱动测试,允许测试人员对程序内部逻辑结构及有关信息来设计和选择测试用例,对程序的逻辑路径进行测试例如:输入某一数据,检查程序中的某一指
31、定条件表达式是否为真。测试用例与技术逻辑覆盖、等价划分、边界值分析、图形技术数据、数据元素与数据项数据:指信息的载体,是对自然界客观事物的符号表示,即所有能有效输入到计算机中并被计算机程序加工和处理的符号的总称。例如:文字、表格、图象等。数据元素(Data element):数据的基本单位。一个数据元素可以有若干个数据项组成。数据项是数据的不可再分的最小单位。数据结构的基本概念数据结构是指计算机程序中所操作的对象数据以及数据之间的相互关系和运算。数据结构包含的内容数据的逻辑结构、数据的存储结构、数据的运算及实现线性结构与非线性结构的概念与区别(见教材 P134)线性结构:数据元素之间存在着一对
32、一的次序关系。非线性结构:集合中的元素不存在一对一的次序关系。数据类型数据类型:是对在计算机中表示的同一数据对象及其在该数据对象上的一组操作表示的总称,数据类型有简单(原子)数据类型和结构类型。10数据类型的定义与特征简单类型、结构类型与指针类型(不涉及具体语言与语句)简单数据结构的应用(可选内容)数组:一组具有相同属性的元素组织在一起形成数组, 如:int A8;数组与链表相比,用数组表示线性表的优点是便于随机存取。但用链表表示线性表的优点是便于删除、插入操作。线性表:由 n(n0)个数据元素组成的有限序列,表中有且仅有一个第一个结点,它没有前驱只有一个后继,有且仅有一个最后一个结点,它没有
33、后继只有一个前驱,其余结点都有一个前驱和一个后继.英文字母表(A,B,C, ,Z)是一个线性表,其中的每一个字母就是一个数据元素。栈(stack):是只允许在一端进行插入和删除的线性表,它是一种操作受限的线性表。是按照后进先出(LIFO)的原则组织数据。例如:若输入序列为 1、2、3、4、5,则输出序列可以是 2、1、3、5、4 或5、4、3、2、1 或 3、4、5、2、1,但不可能输出的序列如 5、3、4、1、2。队列(queue):是只允许在一端进行插入,而在另一端进行删除的线性表,它是一种操作受限的线性表,按照先进先出(FIFO)的原则组织数据。例如:若依次输入 1、2、3 到队列和栈。
34、则从队列输出的是 1、2、3,而从栈输出的次序是 3、2、1。知识点 15:关系数据模型数据库技术的发展过程:人工管理阶段文件系统阶段数据库系统阶段:层次数据库、网状数据库、关系数据库高级数据库技术阶段:分布式数据库、面向对象数据库等等数据模型的概念数据库技术的发展可分为三代:第一代的网状、层次数据库系统,第二代的关系数据库系统,第三代以面向对象模型为主要特征的数据库系统数据模型:对客观事物及其联系的抽象描述,常用工具:E-R 图,树,有向图、关系概念模型(信息世界)使用的主要术语实体:客观存在并可相互区别的事物。可以是具体的人、事、物,也可是抽象的概念或联系。如一个学生, 一个部门;也可以是
35、抽象的事件,如学生一次选课。属性:实体所具有的特征。如学生实体可有学号、姓名、年龄、性别、专业等属性。值域:属性的取值范围,如性别的值域为(男,女) 。键:能唯一标识实体的属性或属性集,如学生实体的键为学号。实体型 :具有相同属性的实体所具有的共同特征,用实体名和属性名集合来表示,如:学生(学号, 姓名, 年龄, 性别, 专业) 就是一个实体型。实体集:同型实体的集合称为实体集,例如学校的全体学生就是一个实体集联系:在现实世界中,事物内部以及事物之间是有联系的。实体间的联系(三种类型)一对一联系(1:1):实体集 A 中的每个实体至多与实体集 B 中的一个实体相对应, 反之亦然,例如:丈夫与妻
36、子之间的联系。一对多联系(1:n):实体集 A 中的每个实体可以与实体集 B中的任意多个实体相对应, 反之, 实体集 B中的每个实体至多与实体集 A 中的一个实体相对应。如班级与11学生间是 1:n的联系。多对多联系 (m:n):实体集 A中的每个实体可以与实体集 B中的任意多个实体相对应,反之,实体集 B中的每个实体可以与实体集 A中的任意多个实体相对应。例如学生与课程间是 m:n 联系。若两个实体之间是多对多的联系,则转化为关系模式时必须为此联系建立一个关系,该联系对应的关系模式属性包括联系本身的属性及所联系的双方实体的主键。掌握 E-R模型的表示方法ER 图提供三种基本图素表示实体型、属
37、性和实体间的联系:实体型:用矩形表示,矩形框内写明实体名;属性:用椭圆形表示,并用无向边将其与相应的实体连接起来;联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n 或 m:n) 。联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来例如:某企业中的产品库、产品、零件、零件库之间的联系可用如下 E-R 图描述:关系模型使用的主要术语关系模式的基本性质:(1)每一列是不可再分的(2)列是同质的,即每一列的取自相同的值域(3)关系中不允许存在两个完全相同的元组(4)元组的顺序无关紧要(5
38、)列的顺序无关紧要(6)不同的列取值范围可以相同,但必须有唯一的属性名关系模型中有关术语关系:二维表元组:表中的一行即为一个元组;属性:表中的一列,列值称为属性值,列名称为属性名值域:属性值的取值范围主键:能唯一标识一个元组的属性集合,如学生关系中的学号关系模式:对关系的描述,一般表示为:关系名(属性 1,属性 2,属性 n) ,如学生关系的关系模式可表示为:学生(学号,姓名,性别,年龄,专业号)非主属性:一个关系模式中不是主属性的属性外键:若属性组 F不是关系 R1的主键,但它是关系 R2的主键,则 F称是关系 R1的外键例如:有三个关系模式:(有下划线的是主键)学生(学号,姓名,性别,专业
39、名称)课程(课号,课程名,学时,学分)成绩(学号,课号,成绩)则成绩关系中的外键是学号,课号。关系的完整性约束:完整性指关系中数据的正确性、相容性,由一系列约束条件组成。一般可分为三类:实体完整性:若 A是关系 R的主属性,则 A不能为空。参照完整性用户自定义完整性产品库 产品 零件 零件库保存 组成 保存1 n m n m 112知识点 16:数据库系统数据库、数据库管理系统、数据库系统、关系数据库的概念数据库 DB:相互间有一定关系的数据,按一定的结构组织在一起的数据集合数据库管理系统 DBMS:管理数据库的软件,如 ACCESS数据库系统 DBS:由数据库、数据管理系统、应用系统、数据库
40、管理员和用户构成关系数据库 RDB:数据模型是采用关系模型的数据库数据库系统的特点数据的结构化且由 DBMS统一管理冗余度低数据共享性高数据的独立性高数据的安全性、完整性、并发和恢复由 DBMS统一控制结构化查询语言的概念(具体语法在实践中考核)数据库应用系统设计(选学内容,可以适当考一些最基本的概念)数据库设计可分为六个阶段:需求分析、概念结构设计阶段、逻辑结构设计阶段、数据库物理设计阶段、数据库实施阶段、数据库运行和维护阶段关系规范化:通常要对关系模式进行规范化,否则将可能产生以下问题:冗余度大、插入异常、修改异常、删除异常例如:未规范的表 STUD_COUR(学号,姓名,性别,课程号,课
41、程名称,成绩)若对它规范化后,可分解为:表 STUD(学号,姓名,性别)和表 COUR(学号,课程号,课程名称,成绩)如果采用“表 STUD_COUR”表示的数据冗余量大,但查找速度快。关系范式:如果关系模式 R的所有属性都是不可再分的数据项,则该关系属于第一范式,记作:R1NF。若 R1NF,并且主键可以决定每一个非主属性,而且不存在主键的真子集可以决定每一个非主属性,则该关系模式为 2NF,记作 R2NF。若 R2NF,并且不存在非主属性可以决定其他非主属性,则该关系模式为 3NF,记作R3NF。例如:关系模式职工(职工号,姓名,出生年月,部门,工资,奖金)属于第 3 范式。关系模式职工(
42、职工号,姓名,出生年月,部门,工资,奖金,总收入)存在数据冗余,不属于第 3 范式。因为总收入可由工资和奖金计算得出。知识点 17:计算机网络的基本概念计算机网络的定义所谓计算机网络就是利用通信设备和线路将地理位置不同的、功能独立的多个计算机系统互连起来,以功能完善的网络软件实现网络中资源共享和信息传递的系统。网络的形成与发展远程终端联机阶段、计算机网络阶段、计算机网络互联阶段、信息高速公路阶段网络的功能数据通信,如传真,E-MAIL; 资源共享(资源指计算机系统的软、硬件和数据资源)提高计算机的可靠性和可用性; 分布式处理网络的基本组成从计算机网络的结构来看,计算机网络主要由通信子网和资源子
43、网组成。13网络的分类(1)广域网 WAN:是一种跨度大的地域网络,通常覆盖一个国家或州。(2)城域网 MAN:一种大型的局域网,使用类似局域网的技术,它可能覆盖一个城市。(3)局域网 LAN:适用于一个建筑物(办公楼)或相邻的大楼内,属于一个部门或者单位组建的专用网络,如公司或高校的校园内部网络。网络协议的概念与 OSI/RM模型协议的概念:为使网内各计算机之间的通信可靠有效,通信双方必须共同遵守的规则和约定称为通信协议。OSI/RM 七层参考模型:从低到高分别是:物理层,数据链路层,网络层,传输层,会话层,表示层,应用层例如:在这七参考模型中,信号的实际传输由物理层实现。万维网 WWW 和
44、 FTP 服务工作于应用层。知识点 18:数据通信基础通信系统模型(信源、信宿、信道)串行与并行通信串行通信:一个字符的各个不同的位按顺序先后发送,在同一个信道上传输,一次发送一个位。适用于远距离传输并行通信:一个字符中的各个位同时传输,一次传输一个字符,在时间上是同时的。一位数据占用一条数据线,根据数据位的不同,需要不同的数据通道,适用于近距离传输。最常见的是我们用的并行打印机。单工、半双工与全双工通信单工:信号只能向一个方向传输半双工:信号可以双向传送,但要交替进行。即:通信双方在每一时刻只能由甲方传给乙方或由乙方传给甲方,这种通信属于半双工通信方式。全双工:信号可同时双向传送同步技术同步
45、通信:通信的收发双方在时间基准上保持一致数据交换技术交换是在发送方、接收方之间传递信息。电路交换电路交换:在通话的全部时间内通话双方用户始终占据端到端的固定传输带宽,并且独占用户线,如电话系统。分组交换分组交换:把信息分割成一个个不超过一定长度的数据包(即分组)来传送,接收方则将收到的分组内容重新组装成原来的信息,如邮件,E-MAIL。常用有线传输介质及特点(教材 P192-P193)双绞线、同轴电缆和光纤是常用的三种有线媒体。常用无线传输介质及特点(教材 P193-P196)无线传输介质有卫星、无线电波(广播,电视) 、红外线(遥控器) 、激光以及微波。基带与宽带传输基带传输:在信道中直接传
46、输“基带信号” (未作处理的原始信号)称为“基带传输” ,传输速度快,信号双向传输,一路信号占用全部带宽,应用于局域网。宽带传输:通过调制技术将多路基带信号迁移到不同频带,从而使信道同时传送多路信号。信号单向传输,如有线电视。信源 信宿信道14有线电视可以同时收看多个频道节目,主要采用频分多路复用技术网络传输速率与带宽比特率(bit rate)单位时间内传输比特位数,单位是 bps(bits per second)带宽(Bandwidth)媒体能够传输的最高频率与最低频率的差值,单位是赫兹(Hz)计算机网络中体现数据传输可靠性的指标是误码率。奈奎斯特定理给出的最大传输速率公式最大数据传输速率
47、C=2Blog2N(bps) 其中 B为带宽,N 为电平数。香农定理给出的噪声影响下的最大传输速率公式最大数据传输速率 C=Blog2(1S/N)(bps),其中 S/N为信噪比。一般 S/N不直接给出,而使用 10lgS/N,单位为分贝 dB。如:若 10lgS/N=20 分贝,则信噪比S/N=100。 若信噪比值为 1000,则对应的分贝值为 10lg1000=30dB。 知识点 19:计算机局域网局域网的特点(教材 P198)局域网的基本概念:在较小的地理范围内,利用通信线路将许多数据设备连接起来,实现彼此之间的数据传输和资源共享的系统称为局域网局域网的拓扑结构局域网的拓扑结构:是指计算
48、机网络的硬件系统的连接形式即网络的硬件布局。最常用的网络拓扑有:总线型,环型,星形,网状,混合。局域网的工作模式对等(Peer to Peer)模式、工作站/文件服务器模式客户机/服务器模式( C/S 模式) (详见教材 P176 和 P200)C/S 为二层结构,即:客户机/服务器访问速度较快,客户端的维护困难、成本高浏览器/服务器模式( B/S 模式) (详见教材 P176 和 P201)B/S 为三层结构,即:客户机 /Web 服务器/服务器访问速度较 C/S 模式慢,分布性强,客户端的维护容易,总成本低。局域网的硬件组成局域网的网络硬件主要包括服务器、工作站、网卡和传输介质局域网操作系统Netware,Unix,Windows NT/2000 Sever网络数据库管理系统软件SQL Sever,Oracle,Visual FoxPro网络应用软件Office 办公套件、各种管理信息系统中继器、集线器、网桥概念及其工作原理中继器:属于物理层,只能接收和转发数据流,只适用于总线拓扑结构的网络。集线器:属于数据链路层,对接收到的信号进行再生整形放大,以扩大传输距离。网桥:属于数据链路层,用于互连两个局域网(在数据链路层以上采用相同协议的两个网络)交换机与交换网络、虚拟局域网概念及其工作原理交换机:把一个网络从逻辑上划分成几个较小的网段。路由器、网关概念及其工作原理路由器:工作