1、给大家提几点要求: 1. 希望大家都能够按时来上课 2. 希望大家每次来上课的时候都能够带上笔书和笔记本 3. 希望大家能够认真完成我所布置的习题 4. 希望大家能够把手机铃声关掉(包括QQ) 5. 希望大家上机的时候尽量不要带耳机、水和食物在接下来的这学期将由我和大家共同学习这门课程。,本书共分为四个模块: 第一模块:计算机基础及微机组装模块(1,2,4,5) 第二模块:办公软件的使用知识模块(6) 第三模块:计算机网络及信息安全知识模块 (7) 第四模块:程序设计及数据库技术模块,多媒体技术模块 (3,8,9),考试宗旨:考会学生,不是考倒学生,给大家说明几点: 1. 课本作为重要参考 2
2、. 做好笔记,会做笔记(尤其操作性内容,一定要记下关键步骤) 3. 每完成一个模块都会有一次考试,每个模块各占20分,一共4次,共80分,平时的作业、考勤和实验占20分。,第一章,计算机的发展、分类、特点和用途计算机系统的组成软件系统和计算机语言计算机中的数制与各进制数之间的转换数据与编码,什么是计算机,计算机发展的关键人物(1)图灵图灵 Alan M. Turing (1912.6-1954.6) 现代计算机的鼻祖。,为纪念图灵对计算机的贡献,美国计算机博物馆于1966年设立了“图灵奖”。,图灵机是一种思想模型,它由三部分组成: 一个控制器,一条可以无限延伸的带子和一个在带子上左右移动的读写
3、头。,第一台计算机ENIAC1946年2月,美国宾夕法尼亚大学-毛克里(J.W. Mauchly)和艾克特(J.P. Eckert) 。是第一台能够真正工作的电脑,计算速度5000次加减运算/秒。,第一台计算机 1946年美国 宾夕法尼亚大学 计算弹道轨迹 5000次加法/秒 体重30多吨 占地170m2 18800只电子管 1500个继电器 功率150KW,两大缺点:没有存储器使用布线接板进行控制计算,布线过程烦琐、耗时,计算速度也就被这一工作抵消了。不是我们现代意义的计算机。,计算机发展的关键人物(2)冯.诺依曼,在ENIAC的研制过程中,美国数学家冯诺伊曼针对它存在的问题,提出一个全新的
4、通用计算机方案,这就是EDVAC方案。在这个方案中,冯诺伊曼提出了三个重要设计思想: (1) 计算机由5个基本部分组成:运算器、控制器、存储器、输入设备和输出设备,(2) 采用二进制形式表示计算机的指令和数据 (3) 将程序(由一系指令组成)和数据存放在存储器中,并让计算机自动地执行程序这就是“存储程序”思想的基本定义。,存储程序工作原理: 计算机的两个基本能力: 一是能够存储程序 二是能够自动地执行程序,John von Neumann 冯诺依曼,计算机是利用“存储器”(内存)来存放所要执行的程序的,而称之为CPU的部件可以依次从存储器中取出程序中的每一条指令,并加以分析和执行,直至完成全部
5、指令任务为止。,按计算机所使用的基本元件大致可以将计算机的发展历程分为四个年代:第一代:电子管 第二代:晶体管第三代:中、小规模集成电路第四代:大、超大规模集成电路,计算机的发展史,第一代(19461954年)电子管计算机内存为磁鼓,外存为磁带,机器的总体结构以运算器为中心,电子管,半导体晶体管,集成电路芯片,大规模集成电路芯片,使用机器语言或汇编语言编程,运算速度为几千次每秒。应用范围小,主要应用于科学和工程计算。,第二代(19541964年)晶体管计算机内存为磁芯存储器,外存为磁盘使用高级语言(如FORTRAN、COBOL)编程,在软件方面还出现了操作系统。运算速度为几万次每秒到几十万次每
6、秒。其主要应用领域为数值运算和数据处理。,第三代(19651970年)采用中、小规模集成电路的集成电路计算机,出现了半导体存储器,外存为磁盘,运算速度为几千万次每秒。机器种类标准化、模块化、系列化,采用积木式结构及标准输入/输出接口。使用高级语言编程,使用操作系统来管理硬件资源。体积减小,功耗、价格等进一步降低,而速度及可靠性则有更大的提高。其主要应用领域为信息处理(处理数据、文字、图像等)。,第四代(70年代初到至今)大、超大规模集成电路计算机实现了电路器件的高度集成化。70年代初,出现微型计算机(PC)以微处理器(MPU,单片IC的CPU)为核心的电子计算机。内存为半导体集成电路,外存为磁
7、盘、光盘,运算速度可达几亿次每秒。计算机进入了几乎所有的行业。,第一代 电子管计算机 1946-1958,第二代 晶体管计算机 1959-1964,体积、重量、运算速度、价格,大,小,慢,快,重,轻,昂贵,便宜,第三代 集成电路计算机 19651970,第四代 大规模与超大规模集成电路 1971今,计算机发展趋势与展望,巨型化 计算机的存储容量更大、运算速度更快、功能更强。 微型化 是以微处理器的发展为特征的。 网络化 传统局域网应用的Client/Server(客户机/服务器)计算模式 面向应用的Browser /Server(浏览器/服务器)计算模式 B/S与C/S混合计算模式,智能化 是
8、要求计算机具有人工智能,即让计算机能够进行图像识别、定理证明、研究学习、探索、联想、启发和理解人的语言等,是新一代计算机要实现的目标。,计算机的分类,进度高、通用性强,用于过程控制和模拟仿真,精度高、通用性强,用于过程控制和模拟仿真,专用计算机和通用计算机专用计算机是最有效、最经济、最快速的计算机,但是它的功能单一,适应性很差。 通用计算机功能齐全,适应性很强,但是牺牲了效率、速度和经济性。 专用和通用是根据计算机的效率、速度、价格、运行的经济性和适应性来划分的。 现在一般意义上讲的计算机都是指通用计算机。,按计算机的规模分类,巨型机 如IBM深蓝、中国的银河系列。主要用于尖端科技领域。 大型
9、计算机 运算速度在每秒几千万次以上的计算机为大型计算机。 主要用于计算中心和计算机网络。 中型计算机 运算速度在每秒百万次以上千万次以下的计算机为中型计算机,与大型计算机的区别不甚明显,通常用在国家重点科研机构、重点理工科院校。,小型计算机 小型计算机的运算速度在每秒几百万次左右。部门内部的核心机。 工作站 工作站实际上是一台高档微机。它的运算速度通常比微机快,配有大容量的存储器和大屏幕显示器,并有较强的网络通信功能。它主要用在计算机图像处理和计算机辅助设计等专业领域。,微型机微型计算机也称个人计算机(PC机)或“微电脑”,简称为“微型机”或“微机”。它是以微处理器(MPU)为核心,加上存储片
10、、输入/输出(I/O)片、系统总线(BUS)和时钟脉冲发生器等大规模集成电路(LSIC), 构成的一种超小型电子计算机。,计算机发展过程中的重要里程碑,1. 第一台电子数字计算机ENIAC的产生 2. 存储程序概念的提出 3. 第一台存储程序计算机1949年在英国剑桥大学问世的EDSAC,由3000只电子管为主要元件的存储结构的计算机。1951年冯诺依曼的EDVAC问世,总共只采用了2300个电子管,但运算速度却比拥有18000个电子管的ENIAC提高了10倍。,4.晶体管计算机的诞生 1954年,贝尔实验室研制成功第一台使用晶体管线路的计算机(TRADIC),装有800个晶体管。 1958年
11、,IBM公司制成了第一台全部使用晶体管的计算机RCA501型。计算速度从每秒几千次提高到几十万次,主存储器的存储量,从几千提高到10万以上。 1959年,IBM公司又生产出全部晶体管化的电子计算机IBM 7090。,5. 第三代计算机的的著名代表1964年,第一个采用集成电路的通用计算机系列IBM 360系统研制成功,该系列有大、中、小型,共6个型号。6. 使用超大规模集成电路的第四代计算机在1967年和1977年,分别出现了大规模集成电路和超大规模集成电路。美国的ILLIACIV计算机,是第一台全面使用大规模集成电路作为逻辑元件和存储器的计算机。,7.微型计算机的出现 Intel系列CPU的
12、发展,特别是1978年推出的8086 16位CPU,为微机的出现奠定了硬件基础。 1980年,IBM实行“开放”政策;采用Intel 8088 MPU、委托独立软件公司为它配置各种软件。 1981年8月12日,IBM在纽约宣布IBM PC个人电脑出世。,计算机的应用,计算机辅助工程(CAD/CAM/CAI) 电子设计自动化(EDA) 电子商务 娱乐,科学计算 数据处理 过程控制 人工智能,计算机的特点,运算速度快,精确度高,具有记忆和逻辑判断能力,计算机内部自动化操作,计算机系统的组成,计算机系统,软件是指能指挥计算机工作的程序和程序运行时所需要的数据,以及与这些程序与数据有关的文字说明和图表
13、资料。其中文字说明和图表资料又称为文档。,软件包括系统软件和应用软件 系统软件是管理、控制和维护计算机硬件和软件资源的软件,以提高其工效,方便用户使用的各种程序的集合。其中操作系统(OS)是最基本、最重要的系统软件。它负责管理计算机系统的全部软、硬件资源。处于系统的核心地位。例如我们下一章要介绍的Windows操作系统。,应用软件是指除了系统软件以外的所有软件,种类繁多。如:AutoCAD、Office、Photoshop等。,软件系统和计算机语言,计算机系统 的层次关系,应用程序,语言处理程序,裸机,计算机的基本结构,应用程序,语言处理程序,操作系统,裸机,计算机的基本结构, 计算机世界中的
14、中国,1952年在清华大学成立中国第一个计算机三人研究小组组长 闵大可 电机系教授 1954年小组经扩充和调整,并入中科院近代物理研究所负责人 钱三强 1958年完成第一台电子计算机103 1959年完成大型电子计算机104 1959年中国自行研究的107计算机问世 1965年中国开始研制第三代计算机(集成电路) 1977年研制成功中国第一台微机DJS050,计算机世界中的日本,辉煌:打败Intel的芯片巨人,迫使Intel 于1985年另辟战场(微处理器)。笔记本电脑的领军人物。失误:第五代计算机(智能计算机)的开发者高清晰度模拟电视。,计算机世界中的印度,世界软件产业王国 1985年,印度
15、软件业产值为1000万美元 1994年,印度软件业产值为10亿美元 2000年,印度软件业产值为50亿美元 在软件出口规模和质量与总产值的比例上, 印度居世界第一。,计算机语言,即程序设计语言。通常分为机器语言、汇编语言和高级语言三类 机器语言是用二进制来表示的,是能被计算机直接识别的语言。 汇编语言较机器语言更容易记忆,适用于编写低层程序,与机器密切相关,不容易使用。,高级语言是我们最为常用的程序语言,是我们用来编写程序的工具,其所编写的程序机器不能直接识别和执行,需通过编译或解释将其翻译成机器指令才能被正常执行。包括:BASIC、C、C+、Java、数据库语言等等。 其中机器语言和汇编语言
16、又统称为低级语言。,数制相关概念,数制:即数的表示方法。 进位数制:按进位的原则进行计数称为进位 数制,简称“进制”。目前常用的进制包括:十进制、二进制、八进制和十六进制。 计算机内则采用二进制方法。(为什么?),由于计算机的各组成部分均是由仅具有两个稳定状态的物理元件电子开关线路组成,因此,计算机中的数据和指令都是用二进制代码表示的。要深入学习计算机的各部分就必须掌握二进制代码的有关知识。,基数:每一进制都有固定数目的记数符号(数码),在进制中允许选用基本数码的个数称为基数。,位权:是指一个数字在某个固定位置上所代表的值,简称权,处在不同位置上的数字所代表的值不同,每个数字的位置决定了它的值
17、。 位权与基数的关系是:各进位制中位权的值是基数的若干次幂。,十进制、二进制、八进制、十六进制,十进制 十进制是我们常用的数制,特征如下:使用10个不同的数码符号0,1,2,3,4,5, 6,7,8,9基数为10每一个数码符号根据它在数中所处的位置(即数位),按逢十进一决定其实际数制,在计算机中,一般用十进制作数据的输入输出。,2. 二进制 在二进制数制中,基数是2,计数的原则是“逢二进一”,特征如下: 使用2个不同的数码符号0,1 基数为2 每一个数码符号根据它在数中所处的位置(即数位),按逢二进一决定其实际数制,3. 八进制 在八进制数制中,基数是8,计数的原则是“逢八进一”,特征如下:使
18、用8个不同的数码符号0,1,2,3,4,5,6,7基数为8每一个数码符号根据它在数中所处的位置(即数位),按逢八进一决定其实际数制,4. 十六进制 在十六进制数制中,基数是16,计数的原则是“逢十六进一”,特征如下:使用16个不同的数码符号0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F基数为16每一个数码符号根据它在数中所处的位置(即数位),按逢十六进一决定其实际数制,思考:怎样区别各种数制? 356 10010 789 69AF,数制的表示方法: 加字母后缀 加D表示十进制数,如10D(D通常被省略) 加B表示二进制数,如10B 加O表示八进制数,如11O 加H表示十六进制数
19、,如101H 加下标表示 直接在数字后加下标,例如:(11)10表示十进制数, (10)2 表示二进制数, (10)8表示八进制数, (10)16表示十六进制数。,常用进位计数制表示方法,各进制之间数值的对应关系,数制之间的转换,1. 将二进制数转换成十进制 任意一个二进制正数B可以通过如下形式转换成十进制 (B)2=Bn-12n-1+Bn-22n-2+.+B121+B020+B-12-1+B-22-2+B-m2-m,2. 将十进制整数转换成二进制整数 将十进制数转换成二进制通常采用的方法是“除以2取余数”。即将十进制数除以2,得到一个商数和余数;再将其商数除以2,又得到一个商数和余数;按此方
20、法继续下去,直到商数等于零为止,每次所得的余数就是对应的二进制数的各位数字,并且第一次得到的余数是二进制数的最低位,最后一次得到的余数是二进制数的最高位。,例1:将十进制数123转换为二进制数2 123 余数2 61 1 二进制数的最低位2 30 12 15 02 7 12 3 12 1 10 1 二进制数的最高位 因此,十进制数123转换成二进制数是1111011B,3. 将十进制小数转换成二进制小数 将十进制数转换成二进制通常采用的方法是“乘以2取整数”。 方法是:用2乘以十进制纯小数,将其结果的整数部分去掉;再用2乘以余下的纯小数部分,再去掉其结果的整数部分;如此继续下去,直到余下的纯小
21、数为0或达到所要求的精度为止。最后将每次得到的整数部分按照先后顺序从左到右排列。 例2:将十进制小数0.6875转换成二进制小数,0.6875 整数 21.3750 1 二进制数的最高位0.3750 20.7500 00.7500 21.5000 10.5000 21.000 1 二进制数的最低位1.000 因此十进制小数0.6875转换成二进制小数为0.1011B,注意:有的十进制小数不一定能完全准确的转换成二进制小数,可以根据精度要求转换到小数点后某一位为止。 在计算机中,数的存储、运算、传输都使用二进制。,4. 将八进制数转换成十进制 任意一个八进制正数B可以通过如下形式转换成十进制 (
22、Q)8=Qn-18n-1+Qn-28n-2+.+Q181+Q080+Q-18-1+Q-28-2+Q-m8-m,5.将十进制数转换成八进制数的方法是:分别按“除以8取余数”和“乘以8取整数”对十进制数的整数部分与小数部分进行转换,然后在组合起来,即可得到相应的八进制数。(与二进制类同) 例:将75D转换成八进制,结果为:113O,7. 将十六进制数转换成十进制 任意一个十六进制正数H可以通过如下形式转换成十进制 (H)16=Hn-116n-1+Hn-216n-2+.+H1161+H0160+H-116-1+H-216-2+H-m16-m,8. 将十进制数转换成十六进制数的方法同八进制和二进制类同
23、,9. 将十六进制数转换成二进制数的方法是:把十六进制数中的每一位数都用相应的四位二进制数来代替。 例:将456H转换成二进制,二进制 十六进制,二进制 八进制,整数从右向左 小数从左向右,二进制转换为八进制或十六进制,整数部分:从低位向高位每3位(八进制)/4位(十六进制) 为一组,高位不足的补0凑足3位 / 4位,然后每组分别按权展开; 小数部分:从高位向低位每3位(八进制)/4位(十六进制) 为一组,低位不足的补0凑足3位 / 4位,然后每组分别按权展开。,10 110 110 111 . 010 1 ( 2 6 6 7 . 2 4 )8,101 1011 0111.0101 ( 5 B
24、 7 . 5 )16,示例: 10110110111.0101,为八进制进制 二进制转换,为十六进制二进制转换,0,0,二进制数的运算 1二进制数的算术运算 (1) 加法运算二进制数的加法规则:0+00 0+1=1+0=1 1+110(向高位产生进位) (2) 减法运算二进制数的减法规则:0-0=0 0-1=1(向高位借位1次,符号位) 1-0=1 1-1=0,例:求11001101B+10011B,例:求11001101B-10011B,(3)乘法运算 二进制的乘法规则为:00=0 01=0 10=0 11=1 (4)除法运算 二进制除法运算与十进制除法类似,也由减法、 上商等操作逐步完成。
25、,2二进制数的逻辑运算 计算机中的逻辑关系是一种二值逻辑,逻辑运算的结果只有“真”或“假”两个值。二值逻辑很容易用二进制的0和1来表示,一般用1表示真,用0表示假。,实现逻辑运算的数学工具为逻辑代数 (布尔代数),逻辑代数的三种基本逻辑关系与 AND、或 OR、非 非A写成 ,00=0 01=0 10=0 11=1,(1)与运算与运算又称逻辑乘,通常用或表示。运算规则为按位进行“与”运算,若进行“与”操作的两位均为1,则结果为1;两位中有一位为0,则结果为0。具体规则如下: 00=0 01=0 10=0 11=1,例:已知X=10111010B,Y=11101011B,求X Y,00=0 01
26、=1 10=1 11=1,(2)或运算 或运算又称逻辑加,通常用或+表示。运算规则是按位进行“或”运算,若进行“或”操作的两位中有一位为1,则结果为1;两位均为0,则结果为0。具体规则如下:00=0 01=1 10=1 11=1,例:已知X=10111010B,Y=11101011B,求X Y,(3)非运算 非运算实现对单个逻辑值的处理,也称为逻辑取反操作,通常用表示。运算规则如下:,符号数的表示 数据包括数值型数据与非数值型符号数据。 符号数据为非数值信息,包括字符、文字、图形等形式的数据,它不表示数量的大小,只代表一种符号。,数 据 存 储 的 组 织 结 构,位:计算机存储设备的最小单位
27、 字节:计算机处理数据的基本单位 字长:CPU一次处理数据的二进制位数,在计算机中,一般用若干个二进制位表示一个数或一条指令,把它们作为一个整体来处理、存储和传送。 计算机字:即作为一个整体来处理的二进制位串。 表示数据的字称为数据字,表示指令的字称为指令字。 计算机是以字为单位进行处理、存储和传送的,字长一定,则计算机数据字所能表示的数的范围也就确定了。,例如使用8位字长计算机,它可表示无符号整数的最大值是(11111111)2=(255)10。 溢出:运算时,若数值超出机器数所能表示的范围,就会停止运算和处理,这种现象称为溢出。,机器数和真值 在计算机中只能用数字化信息来表示数的正、负,人
28、们规定用0表示正号,用1表示负号。例如,在机器中用8位二进制表示+90,其格式为: 1011010 符号位,0表示正,0,用8位二进制表示-89,其格式为:1011001符号位,1表示负 在计算机内部,数字和符号都用二进制码表示,两者合在一起构成数的机内表示形式,称为机器数。在计算机数值表示中,用正负号加绝对值表示数据的形式被称为“真值”,即机器数真正表示的数值。,机器数:,真值:,数据在计算机中的表示方式,机器数,0,1,0,0,1,1,0,1,+77,符号位,真值,机 器 数 / 真 值,计算机中运算的数,有整数,也有小数,如何确定小数呢?根据小数点的位置,通常将计算机中的数据分为两种:即
29、定点数和浮点数,定点数和浮点数 定点数:即小数点的位置固定不变的机器数。 浮点数:小数点的位置可以浮动的机器数。 微型计算机多选用定点数。 定点表示法简单直观,但所能表示的数值范围很有限,运算时容易产生溢出。,浮点表示法类似于十进制中的科学计数法。 计算机中的浮点表示法包括两个部分:一部分是阶码,表示指数,记作E;另一部分是尾数,表示有效数字,记作M。 采用浮点表示法,二进制数N可以表示为:N=M2E,其中2为基数,E为阶码,M为尾数。,31 30 24 23 22 0,浮 点 数,如:将十进制数“55”以浮点数格式存放(55)10 = (110111)2 = 0.110111 * 26,计算
30、机中为了运算的方便,对带符号数有3种表示方法:原码、反码、补码,主要目的是解决减法运算,(1)原码 一个二进制数,最高位表示数的符号位,其他位表达数值,这样的二进制数表示法叫原码表示法。原码形式与二进制数的原来表示方法基本一样。原码中增加了专门表示数的正负的符号位,也就是用0表示正号,用1表示负号最左边一位的0和1不带表具体数值,分别表示“+”和“-”,(2)反码 用反码表示带符号数规定:正数的反码与原码相同,负数的反码则为除符号位外的其余各位按位取反。,(3)补码 补码是计算机中带符号数的实用表示方法。 规定正数的补码与原码和反码是一样的,负数的补码可由其反码的末位加1,例:求十进制数8和-
31、8的补码,例:机器字长为8位,当X=-44,Y=-53 时,求X补+-Y补,X=-101100,X原=10101100,X反=11010011,X补=11010100,同理求得-Y补=00110101,1 1 0 1 0 1 0 0+ 0 0 1 1 0 1 0 11 0 0 0 0 1 0 0 1丢掉,计算机编码,BCD码 (余三码 / 8421码),国 标 码 (7445),ASCII码,汉字编码,字符编码,二进制编码 的十进制数,西文字符的二进制编码 字符是计算机中另一种重要的数据形式,它们也必须按特定的规则用二进制编码表示。编码可以有各种方式,目前在微机中最普遍采用的是ASCII码,即
32、美国标准信息交换码(American Standard Code for Information Interchange)。,ASC码是目前世界范围内通用的字符编码标准。由7位二进制数所组成,一共包含27即128个字符,其中32种为控制字符,其余96种为数字、大小写英文字母和专用符号的编码。由于一个字节包括8位,所以高位补0。,表 ASCII码字符表,一般情况下,不需要背诵各种字符的ASCII码值,需要时可查表。但应了解字符的编码规律。例如,ASCII码值从小到大的编码顺序是控制字符、数字、大写字母、小写字母;94个图形字符的ASCII码为21H7EH;小写字母比对应的大写字母ASCII码值大
33、32。,十进制数的二进制编码用二进制编码来表示十进制数的编码就称为二十进制码,简称BCD(Binary Coded Decimal)码。这种编码的特点是保留了十进制的权,而数字则用0和1的组合来表示。 常见的BCD码是8421码,它是用4位二进制数表示1位十进制数字,既具有二进制的形式,又具有十进制的特点,使二进制和十进制之间的转换得以快捷的进行。,00000 10001 20010 30011 40100 50101 60110 70111 81000 91001 例如:541的BCD码就是原因:0101=8x0+4x1+2x0+1x1=5 0100=8x0+4x1+2x0+1x0=4 00
34、01=8x0+4x0+2x0+1x1=1,4,1,0100,0001,5,0101,汉字编码:包括:汉字输入码、国标码、内码与外码及汉字字形码。,汉字编码 1汉字输入码汉字输入编码很多,可归纳为四类:数字编码、字音编码、字形编码和音形编码。区位码属于数字编码,以汉字拼音为基础的编码属字音编码,五笔字型输入法是使用广泛的字形编码。不管采用哪一种输入编码,汉字在计算机中的内码、交换码都是一样的,由该种输入方法的程序自动完成输入码到内码的转换。,2汉字国标码与区位码为了适应汉字信息处理的需要,1981年我国颁布了信息交换用汉字编码字符集基本集,简称GB231280。它规定了信息处理交换用的6763个
35、汉字和682个图形字符的编码。其中汉字分为两级,第一级3755个,按汉语拼音字母顺序排列,同音字以笔划顺序为序。第二级3008个,按部首顺序排列。,GB2312-80是一种双7位代码结构,如图所示。为了使控制字符和图形字符互不干扰,规定其中任何一个字节(最高位为0)都不应和34个控制字符的ASCII码相同,于是每一字节的编码在21H7EH之间。,图 GB2312-80编码表,把GB2312-80编码表中两个字节编码连接起来,即得到汉字的国标码。如“啊”的第一字节编码为30H,第二字节编码为21H,即“啊”的国际码为3021H。GB2312-80编码表中有94行94列,行号称为区号,列号称为位号
36、。如果把区号和位号组合起来就是区位码。如“啊”的区位码为1601,“”的区位码为0633。注意区号和位号都用两位十进制数表示,不足两位前面补0。,3汉字机内码汉字机内码是指汉字在计算机内部进行存储和加工处理时所使用的代码。汉字输入方式有许多(输入码),但其内码是统一的。汉字的国标码不能直接作为汉字内码,它会与ASCII码字符相混淆。例如“中”的国标码是5650H,而ASCII码字符串“VP”的内部编码也是5650H,这就产生了二义性。,4汉字的输出 在计算机内部,只对汉字内码进行处理,不涉及汉字本身的字形。若要输出汉字处理的结果,则必须把汉字内码还原成汉字字形。一个字符集的所有字符的形状描述信
37、息集合在一起称为该字符集的字形信息库,简称字库。不同的字体(如宋、仿、楷、黑等)有不同的字库。每输出一个汉字,都必须根据内码到字库中找出该汉字的字形描述信息,再送去显示或打印。,描述字符(包括汉字)字形的方法主要有两种:点阵字形和轮廓字形。点阵字形由排成方阵(如1616、2424、4848等等)的一组二进制数字表示一个字符,1表示对应位置有笔划,0表示对应位置无笔划。1616点阵字形常用于屏幕显示,笔画生硬、细节难以区分,打印输出常用2424、4040、4848,甚至9696点阵。点阵的数目越多,笔锋越完整,字迹亦清晰美观。,图中显示的“英”字,使用1616点阵。字形中每一点使用一个二进制位表
38、示,这样,一个1616点阵的汉字总共需要1616/8=32个字节表示。字形编码的表示顺序为从左到右、从上到下。图中“英”字的字形编码分别为04H、10H、70H、07H等32个字节。,图 汉字点阵字形及编码,轮廓字形表示比较复杂。该方法用一组直线和曲线来勾画字符(如汉字、字母、符号、数字等)的笔画轮廓,记下构成字符的每一条直线和曲线的数学描述(端点和控制点的坐标)。轮廓字符描述的精度高,字形可任意缩放而不变形,也可按需要任意变化。轮廓字形在输出之前必须通过复杂的处理转换成点阵形式。Windows True Type字库就是典型的轮廓字符表示法。,各种汉字编码之间的关系,5汉字编码标准集的扩充
39、1993年国际标准化组织发布了通用多八位编码字符集(Universal Coded Character Set,UCS)的国际标准ISO/IEC 10646-1。这一标准规定了全世界现代书面语言文字所使用的全部字符的标准编码,用于世界上各种语言文字、字母符号的数字化表示、存储、传输、交换和处理,真正实现了所有字符在同一字符集内等长编码、同等使用的多文种信息处理。,UCS编码字符集的总体结构有组、平面、行、字位构成四维编码空间,即UCS有007F共128个组、每个组有00FF共256个平面、每个面有00FF共256行、每行有00FF共256个字(位),每个字位用一个字节表示。这样,UCS中每一个
40、字符用四个字节编码,对应每个字符在编码空间的组号、平面号、行号和字位号,称为四八位正则形式,记作UCS-4。UCS-4提供了极大的编码空间,可安排多达13亿个字符,充分满足世界上多种民族语言文字信息处理的需要。,我国等同采用此标准制定了新的中文编码扩展国家标准GB 13000.1-1993,并提出了汉字内码扩展规范GBK-1995。中文Windows 95/98采用的是GBK大字符集,该字符集中收录的汉字多达20902个,比GB字符集的6763个增加了2倍以上。有了GBK大字符集,以前遇到的生僻汉字现在几乎全能由计算机处理,这样大大地方便了用户。 国家标准GB18030-2000信息交换用汉字
41、编码字符集 基本集的扩充是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。,GB18030编码空间约为160万码位,目前已编码的字符约2.7万。随着我国汉字整理和编码研究工作的不断深入,以及国际标准ISO/IEC 10646的不断发展,GB18030所收录的字符将在新版本中增加。 GB18030-2000的编码长度由GB2312-1980的双字节变为单字节、双字节和四字节。其中单字节编码的值从0到7FH(对应于ASCII码的相应码位);双字节编码第一个字节的值从81H到FEH,第二个字节的值从40H到FEH(不包括7FH);四字节编码第一个字节的值从81H到FEH,第二个字节的值从30H到39H,第三个字节的值从81H到FEH,第四个字节的值从30 H到39H。,GB 18030完全兼容GBK、GB2312,并且是后两者的替代标准,也将是今后唯一的字符集国家标准。GB 18030和GB13000.1在词汇上兼容,码表则不兼容。例如,两个标准中都会有“啊”字,但两个标准中,“啊”的内码是不同的。,谢 谢 大 家,