1、1,苏州大学计算机工程系,徐云龙,新编计算机应用基础,2000年11月,2,第2章 信息在计算机内的表示,2.1 数据和信息2.2 二进制2.3 数值信息在计算机内的表示2.4 西文信息在计算机内的表示2.5 中文信息在计算机内的表示2.6 图形信息在计算机内的表示,3,2.1 数据和信息,一、数据,采用二进制编码表示的数字、文字、图画、声音和活动图象才能由计算机进行处理。,数据是对事实、概念或指令的一种特殊表达形式,这种特殊的表达形式可以用人工的方式或者用自动化的装置进行通信、翻译转换或者进行加工处理。,二进制编码,4,数据区分为,数值型数据非数值型数据文字图形声音活动影像,5,二、信息的概
2、念,信息是对人有用的数据, 这些数据将可能影响到人们的行为与决策。 数据是客观存在的事实、概念或指令的一种可供加工处理的特殊表达形式。,6,计算机信息处理,数据处理的主要目标是获取有用的信息。,本质:是由计算机进行数据处理的过程,计算机对数据的采集、输入、转换、合并、加工、分类、计算、统计、汇总、存储、建库、传送等操作的过程。,数据处理加工后,向人们提供有用的信息。,7,2.2 二进制,十进制数:333,3个,3百,3十,权:每个数位所固有的值。如1、10、100。,8,一、什么是二进制,十进制(D)十种状态,逢十进一, (0,1,2,3,4,5,6,7,8,9)二进制(B)两种状态,逢二进一
3、,(0,1)八进制(Q)八种状态,逢八进一,(0,1,2,3,4,5,6,7)十六进制(H)十六种状态,逢十六进一(0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F),9,状态少(0、1),物理实现容易运算规则简单计算机的理论基础是数理逻辑,计算机中为什么要采用二进制?,10,算术运算加法0+0=0 0+1=1 1+0=1 1+1=10(进位)减法0-0=0 0-1=1(借位) 1-0=1 1-1=0逻辑运算逻辑加0V0=0 0V1=1 1V0=1 1V1=1逻辑乘00=0 01=0 10=0 11=1取反0=1 1=0,二、二进制的运算,11,各进制数之间的关系,12,三、不同
4、进位制数之间的转换,1、r进制转换成十进制按权展开法(ana1a0.a-1a-m)r=anrn+a0 r0+a-1 r-1+a-m r-m (10101)2=24+22+1=21 (101.11)2=22+1+2-1+2-2=5.75 (101)8=82+1=65 (71)8=7 8+1=57 (101A)16=163+16+10=4122,13,2、十进制转换成r进制,整数部分:除以r取余数,直到商为0, 余数从右到左排列。小数部分:乘以r取整数, 整数从左到右排列。,不一定能精确转换,先得到的数总是紧靠小数点。,另法:20=121=222=423=824=16,25=3226=6427=1
5、2828=25629=512210=1024,14,例,(100.345)10(1100100.01011)2 (100)10=(144)8=(64)16,15,3、八进制和十六进制转换成二进制,每一位八进制数对应三位二进制数。(1分3)每一位十六进制数对应四位二进制数。(1分4)(2C1D)16=(0010 1100 0001 1101)2 2 C 1 D(64)16=(0110 0100)2 (144)8=(001 100 100)2 6 4 1 4 4(7123)8=(111 001 010 011)2 7 1 2 3,16,4、二进制转换成八进制和十六进制,转换成八进制时三位一组。(3
6、合1)转换成十六进制时四位一组。(4合1)分组方法:从小数点向两边三(四)位一组, 位数不足整数前补0,小数后补0。(11 0110 1110. 1101 01)2=(36E.D4)16 3 6 E D 4(1 101 101 110. 110 101)2=(1556.65)8 1 5 5 6 6 5,后面补两个0,变成0100,17,五、二进制的运算,两种类型的运算:算术运算、逻辑运算。算术运算 按位运算有进位,借位 常用运算种类:加,减逻辑运算 按位运算,无进位,借位 常用运算种类:与,或,非,18,算术运算规则,19,逻辑运算规则,非运算即为取反:0取反后是1,1取反后是0。,20,六、
7、二进制信息的计量单位,最小单位:比特(Bit),二进制的一位。运算和处理二进制信息时使用的单位 ( Bit, Byte, Word )存储二进制信息时的度量单位 ( B,KB, MB, GB, TB )传输二进制信息时的度量单位(传输速率) (bps, Kbps, Mbps, Gbps )1K=210=1024 1M=220=1024K 1G=230 1T=240,21,2.3 数值信息在计算机内的表示,1、整数的定点表示 整数在计算机内有两种表示: 无符号整数 带符号整数 符号位在最高位:0表示正,1表示负。 m位无符号数的取值范围:02m-1 m位带符号数的取值范围:-2m-1+12m-1
8、-1,22,2、机器数的表示,机器数:一个数及其符号在机器中的数值化表示。真值:机器数所代表的数。负数的表示有:(假定一个数在机器中占用n位),相同位数的补码表示数的范围比原码和反码多一个。,23,3、实数的浮点表示,浮点数存储格式:,设尾数为4位,阶码为2位,N=2111011,24,2.4 西文信息在计算机内的表示,西文是由拉丁字母、数字、标点符号及一些特殊符号组成,它们统称为“字符”(Character)。 目前计算机中使用最广泛的西文字符集为ASCII码。(美国标准信息交换码,7位) American Standard Code for Information Interchange
9、较常用的另一种编码:EBCDIC(8位) Extended Binary Coded Decimal Interchange Code,25,ASCII码,常用字符有128个,编码从0到127。控制字符:032,127;普通字符:94个。每个字符占一个字节,7位,最高位为0。,26,2.5 中文信息在计算机内的表示,汉字在不同的处理阶段有不同的编码。汉字的输入:输入码汉字的机内表示:机内码汉字的输出:字形码(字库 Font)各种编码之间的关系:,27,汉字的输入码,数字码 如:电报码、区位码、纵横码字音码 如:全拼、双拼、微软拼音字形码 如:五笔字型音形码 如:声形码,28,汉字的机内码,汉字
10、在信息处理系统内部最基本的表达形式。GB2312-80规定了7445个字符。(国标码)汉字6763个:一级汉字3755个,二级汉字3008个。汉字分区:94行(区),94列(位)(区位码)每个汉字两个字节。机内码:最高位置1。问:以下一组机内码中一共有几个汉字?B5C1416AEAD889H,29,区位码、国标码与机内码的转换关系,Q1+20H=G1 Q2+20H=G2G1+80H=J1 G2+80H=J2J1,J2为机内码的高字节与低字节;Q1,Q2为区位码的区号和位号;G1,G2为国标码的高字节与低字节。,30,其他汉字编码,UCS(通用编码字符集) 包括全世界现代书面语言文字的所有字符,
11、4字节编码。Unicode UCS的16位格式的子集,与ASCII码不兼容。CJK:包含于Unicode中,2万多汉字符号。GBK:汉字扩展内码规范,与GB2312-80兼容。BIG5:台湾汉字编码规范。,31,汉字的字形码,点阵字形 1616、24 24、48 48 一个1616点阵汉字字形码占32(16*16/8)字节。轮廓字形 把汉字笔画的轮廓用一组直线和曲线勾画。 记录的是这些几何形状之间的关系。 精度高。 Windows的TrueType字库采用此法。,32,2.6 图形信息在计算机内的表示,图像方法(Image) 单色图像 用一个二进制数表示一个像素(pixel)的灰度。 彩色图像 用三个二进制数分别表示RGB的灰度。图形方法(Graphics) 用几何图形、物体的材料与性质、环境、 观察位置等来描述。,