1、课前回顾,计算机发展的历史(产生之前,产生之后,未来) 计算机的概念/特点、应用领域、类型 计算机的系统组成 信息技术基础,计算机是信息处理的工具,任何信息必须转换成二进制形式数据后才能由计算机进行处理,存储和传输。本章主要介绍计算机中采用的二进制及其运算规则,二进制与其它进制之间的转换;计算机中度量信息的数据单位;不同类型的数据采用的信息编码等。,第二章 计算机信息基础,2.1 计算机所使用的数制,数制也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。,2.1.1 数制的概念,基数:R进制的基数=R,2.1 计算机所使用的数制,2.1.1 数制的概念,位权:在数制中,各位数字所表
2、示值的大小不仅与该数字本身的大小有关,还与该数字所在的位置有关,我们称这关系为数的位权。 位权:一个与数字位置有关的常数,位权=Rn 其中n取值:以小数点为界,向左 0,1,2,3, 向右-1,-2,-3 例:(275.8)10=210271015100810-1,2.1 计算机所使用的数制,常 用 数 制 的 对 应 关 系,2.1 计算机所使用的数制,2.1.2 二进制的运算,二进制的算术运算,加: 0+0=0 0+1=1 1+0=1 1+1=10,减: 0-0=0 0-1=1 1-0=1 1-1=0,乘: 00=0 01=0 10=0 11=1,除: 00=0 01=0 10(无意义)
3、11=1,二进制1010+110=?,二进制的逻辑运算,与AND: 00=0 01=0 10=0 11=1,或OR: 00=0 01=1 10=1 11=1,0表示“假、否”,1表示“真、是”,2.1 计算机所使用的数制,110 101,110 101,110,十进制数,二、八、十六进制的转换,由一种数制转换成另一种数制,2.1 计算机所使用的数制,2.1.3 二进制和其它进制的转换,十进制转二进制:整数部分除以2取余,直至商为0;小数部分乘以2取整,直至小数部分为0或达到所需精度为止。十进制转八进制:方法同上。整数部分除以8,小数部分乘以8。十进制转十六进制:方法同上。整数部分除以16,小数
4、部分乘以16。,2.1 计算机所使用的数制,结果为:1001011,0.6875 2 1 1.3750 20 0.7500 21 1.5000 21 1.0000,结果为:0.1011,(75.6875)10=(1001011.1011)2,2.1 计算机所使用的数制,结果为:113,结果为:4B,16 75 B16 4 40,2.1 计算机所使用的数制,结果为:0.54,结果为:0.B,2.1 计算机所使用的数制,0.6875 8 5.5.5 84 4.0,0.6875 16 11.11.0,2.1 计算机所使用的数制,常 用 数 制 的 对 应 关 系,整数部分从右向左,小数部分从左向右,
5、 每3位二进制一组,变为1位八进制。 不足3位时分别在最左端和最右端补0凑够3位。 例:(1100101001011.1101)2 = (14513.64)8,2.1 计算机所使用的数制,二进制 十六进制,整数部分从右向左,小数部分从左向右, 每4位二进制一组,变为1位十六进制。 不足4位时分别在最左端和最右端补0凑够4位。 例:(11010111101.1010001)2 = (6BD.A2)16,2.1 计算机所使用的数制,例: (1011.1)2 = 123 + 022 + 121 + 120 + 12-1= 8 + 0 + 2 + 1 + 0.5= (11.5)10,二进制、八进制、十
6、六进制 十进制,位权相加法:各位数码乘位权,再相加。,2.1 计算机所使用的数制,十进制数,二、八、十六进制的转换,由一种数制转换成另一种数制,2.1 计算机所使用的数制,课前回顾,数制、基数、位权概念二进制的算术和逻辑运算各种进制的转换,2.2 计算机中的数据单位,位(bit):计算机存储数据的最小单元(0、1),字节(Byte):处理数据的基本单位(8bit/Byte),字长:CPU一次处理数据的二进制位数。,常用的字节计数单位:1KB1024 Byte (210B) 1MB1024 KB (220B)1GB1024 MB (230B) 1TB1024 GB (240B),2.3 信息表示
7、与编码,所谓编码,就是利用数字串来标识所处理对象的不同个体。计算机采用的是二进制,这就意味着所有需要计算机处理的信息,如数值、字母、汉字、符号、声音、图像等,都要用0和1组成的二进制编码形式来表示。,2.3.1 整数的表示,在数学中,数值是用“”和“”表示正数和负数的,而在计算机中只有0和1,所以正负号也用0和1表示,即数值符号数字化。,2.3 信息表示与编码,符号位:在有符号的二进制数中,最高位用0表示“正”,1表示“负”。 机器数:正负符号被数值化了的数。 真值:该机器数所表达的数值。,2.3 信息表示与编码,原码:正号为0,负号为1,数值部分为绝对值的二进制。1-3 反码:正数的反码和原
8、码相同;负数的反码是将其原码除符号位外各位取反。+0,-0 补码:正数的补码和原码相同;负数的补码是将其反码在末位加1。,+5的原码、反码和补码都是00000101,在有符号运算中,需要通过原码、反码、补码转换来完成运算。,2.3.2 实数的表示,定点数,小数点位置固定的数称为定点数。定点整数:小数点隐含固定在数值部分最右端。定点整数是纯整数,其符号位右边所有的位数表示的是一个整数。,2.3 信息表示与编码,定点整数: (-3),符号位,定点小数: (+0.5),符号位,2.3 信息表示与编码,定点小数:小数点隐含固定在数值部分最左端。定点小数是纯小数。,浮点数,小数点位置不固定的数称为浮点数
9、,它既有整数部分又有小数部分,如123.55、33.789等。 在计算机中通常把浮点数分成阶码和尾数两部分来表示,也就是平时所说的科学记数法 。为保证不损失有效数字,对尾数进行规格化处理,即保证尾数的最高位为1,实际数值通过阶码进行调整。例如,二进制实数1010.1101可以用0.101011012100表示。(注:100等同于十进制的4),2.3 信息表示与编码,例:将十进制数 +55 以浮点数格式存放。(55)10 = (110111)2 = 0.110111 * 26,浮点数:字长4字节,则阶码部分为8位补码定点整数,尾数部分为24位补码定点小数。,31 30 25 24 23 22 7
10、 0,0,1,0,0,0,1,0,1,0,0,阶码部分,尾数部分,阶码 符号位,尾数 符号位,2.3 信息表示与编码,1,1,0,(注:6等同于二进制的110),例:将十进制数 -55 以浮点数格式存放。 (略)-(55)10 = -(110111)2 = -0.110111 * 26 其中(-110111)的反码为:1001000,补码:1001001 尾数格式:0.1001(小数点右移2位,指数变为24),31 30 25 24 23 22 7 0,1,1,0,0,0,0,0,1,0,0,阶码部分,尾数部分,阶码 符号位,尾数 符号位,2.3 信息表示与编码,0,0,0,隐含小数位,(注:
11、6等同于二进制的110),(注:6等同于二进制的100),2.3.3 十进制数的编码BCD码,编码和数值是完全不同的!,BCD码(8421码):二十进制编码,用4位二进制码表示1位十进制数。(不能参与运算) 例: (13579)10 =(0001 0011 0101 0111 1001)BCD (0110 1000 0000 . 0010 0100)BCD =(680.24 )10,2.3 信息表示与编码,2.3.4 西文字符的编码ASCII码,ASCII码(American Standard Code for Information Interchange) 128个常用字符,用7位二进制编
12、码,占一个字节,最高位0。其中,控制字符:032,127;普通字符:94个。,2.3 信息表示与编码,2.3.5 和汉字有关的编码,汉字输入码:操作人员通过键盘输入的汉字编码。 数字编码:如区位码; 拼音编码:如全拼、智能ABC、微软拼音输入法等; 字形编码:如五笔字型法等 。,2.3 信息表示与编码,(2) 国标码和区位码1980年颁布(GB2312-80) ,是中文信息处理的国家标准,是大陆及海外使用简体中文的地区使用的中文编码。每个汉字占两个字节的编码,且每个字节最高位均为0。,2.3 信息表示与编码,该编码共收录6763个简体汉字、682个符号,其中汉字部分:一级汉字:3755个,以拼
13、音排序 ;二级汉字:3008个,以偏旁排序 。所有汉字分94个区,每个区94个汉字。由此构成区位码。而区位码的区码和位码各加32就得到国标码。,(3) 机内码计算机内部存储和加工汉字所用的编码。不管用哪一种汉字输入法输入的汉字,在计算机内部都是由国标码转换成机内码来表示的。 每个汉字的机内码占两个字节,每个字节最高位为1。 汉字 国标码 汉字机内码 中 8680(01010110 01010000)2 (11010110 11010000)2 华 5942(00111011 00101010)2 (10111011 10101010)2 中 5448(区位码) 华2710 (区位码) 注:十进
14、制表示的国标码的每个字节减32即得区位码。,2.3 信息表示与编码,点阵汉字:每一个汉字以点阵形式存储,有点的地方为“1”,空白的地方为“0”。有1616、2424、4848点阵等。点阵越大,字形分辨率越好,字形也越美观,但汉字存储的字节数就多,字库也就越庞大。,2.3 信息表示与编码,(4)汉字字形码汉字存储在计算机内采用机内码,但输出时必须转换成字形码,再根据字形码输出汉字。字形码又称汉字字模,用于在显示器或打印机上输出各种文字和符号。通常有两种:,2.3.5 和汉字有关的编码,矢量汉字:将汉字的笔画轮廓用一组直线和曲线来勾画,并记录存储每一直线和曲线的数字描述(端点及控制点的坐标)。在需
15、要输出时,根据字形轮廓的描述计算出汉字点阵。矢量产生的汉字即使放大仍能保持较好的质量。,2.3 信息表示与编码,汉字字库一般都存放在磁盘上,这种字库称为“软字库”,使用时根据汉字内码到字库中找到相应的字形码,然后调入内存并显示或打印。,计算机处理汉字的基本过程,用户用键盘输入汉字的外码(输入码),然后通过代码转换程序到码表中去检索机内码,汉字内码负责对汉字进行储存、处理、加工。输出时,利用字形检索程序在汉字字模库中查到表示这个汉字的字形码,然后在显示器或打印机上输出。,2.3 信息表示与编码,(5) 其它编码GBK编码:是对GB2312的扩充。仍采用双字节编码,在此基础上对罕见汉字使用四字节编
16、码,共收录了2.7万个汉字,与国标码兼容,同时收录了藏、蒙、维吾尔等主要少数民族文字。 BIG5码:台湾、香港等地区使用的繁体汉字编码标准。,2.3 信息表示与编码,2.3.6 多媒体信息的数字化,数字化就是对模拟世界的一种量化,表示信息的最小单位是位(bit)“0”或“1”。多媒体信息在计算机中也要转换为0和1,因此也需要进行编码。也就是说无论是文字、图像、声音或视频,数字化后都可分解为一系列0或1的排列组合。各种多媒体信息在进入到计算机中进行运算、存储、传输等过程中,需要进行数字化处理,输出时再将其还原成各自本身的特性呈现在我们面前。,2.3 信息表示与编码,2.3 信息表示与编码,各种多媒体信息的数字化处理过程示意图,