1、1.3 计算机的数据与编码,一、基本概念 1. 数据 是指能够由计算机处理的数字、字符和符号等。 2. 信息 是指经处理后有价值的数据,它包括数值、文字、声音、图形和图像等对象。,3.计算机的内部信息,控制信息,数值数据,数据信息,非数值数据,图形数据各种文字符号数据逻辑数据,4.数据在计算机中的存储 1)存储设备存储信息的设备,如内存、硬盘、软盘及光盘等,存储设备的最小单位是“位”,存储信息的单位是字节。,2)存储容量 存储设备所能容纳的二进制信息量的总和为存储容量,用字节数来表示。 注:内存容量指为计算机系统所配置的主存(RAM)总字节数,单位是“KB”、“MB”,如32MB、64MB等。
2、,二、计算机的数据存储单位,位(bit):数据的最小单位,由数字0或1组成,用字母b表示。,2. 字节(Byte):8个二进制位称为一个字节,它是计算机处理数据的基本单位,用字母B表示。,3. 字(word): 计算机一次存取、处理和传输的数据长度称为字,通常由一个字节或多个字节构成。,1B=8b 1KB=210B=1024B1MB=220B 1GB=230B 1TB=240B,4. 字长 : 一个字中所包含的二进制数的位数称为字长。,三、数据编码,1.ASCII 码1)是使用最多和最普遍的字符编码,即美国信息交换标准代码(American standard code for Informat
3、ion Interchange)。 2)ASCII码有7位码和8位码两种形式 。3)7位ASCII码:用七位二进制数进行编码的,可以表示128个字符,最高位恒为0。,4)8位ASCII码:用8位二进制数进行编码,可以表示256种字符;当最高位恒为0,与7位ASCII码相同,称为基本ASCII码;当最高位为1时,形成扩充ASCII码,各国一般把该码作为本国语言的字符代码。,5)键盘输入的数码09、52个大、小写英文字母A Z、a z、32个标点符号、运算符号、专用符号和34个控制符,采用7位ASCII码编码。 6)ASCII码是一种西文机内码。,例:字符A的显示,A的ASCII码 41H给出字符
4、发生器高位地址,000010000 000101000 001000100 010000010 011111110 010000010 010000010 010000010,字符的点阵组成字库,按照地址从字库中读出该字符。,2.汉字编码,输入码,机内码,输出码,汉字信息处理过程,汉字的输入,输入编码,国标码,汉字内码,存储或处理,计算机在处理汉字信息时也要将其转化为二进制代码,计算机对汉字进行编码.,1)输入码(外码)通过键盘向计算机输入汉字的编码。,2)国标码与区位码,GB2312-80: 一级常用汉字3755个, 按拼音字母顺序排列。二级汉字3008个, 按部首排列,684个非汉字图形字
5、符。共7445个字法字符。,所有汉字字符用2个字节表示,高字节共分为94个区(01-94区),低字节分为94个位( 01 -94位), 汉字所在的区号和位号共同组合成该汉字的区位码,区位码为十进制。,非汉字图形字符排在01-15区; 一级汉字排在16-55区; 二级汉字排在56-87区;,例:“中” 区号54、位号48 ,区位码为5448“国” 区号25、位号90,区位码为2590,国标码的转换:将汉字的区位码表示成16进制,在加上2020H。即:国标码=(区、位码)16+2020H,( 48 )10,(54)10,“中”的国标码=3630H+2020H=5650H,西文字符:采用 7位ASC
6、II码作为机内码。 汉字:机内码用两个字节来保存,字节高位为1,前一字节保存高位内码,后一字节保存低位内码,即:国标码的字节高位恒为1。,3)机内码(汉字内码),汉字内码:是供计算机内部进行存储、处理和传输时统一使用的代码。,机内码与国标码的换算关系:汉字内码=汉字国标码+8080H,“中”的机内码=5650H + 8080H= D6D0H “国”的机内码=397AH + 8080H= B9FAH一个汉字可有几个外码,但只有一个机内码。,4)输出码,是对汉字字形经过点阵数字化后的一串二进制数,又称为汉字字形码或字模。一般显示用1616点阵,打印用2424、3232、4848等点阵。点阵越多,打
7、印的字体越好看,但占用的存储空间也越大.,汉字的显示,内码,字型数据,内存中的汉字字型库中提取字型数据,字型数据送到输出设备上输出,5)系统代码交换流程,四、计算机中数的表示,1.真值 机器外存放的由正负号表示的数。 2.机器数 能直接存放在计算机内的数据,最高位作为数值的符号位,“0”表示正数,“1”表示负数。,3. 带小数点的数的表示方法,根据小数点的位置是否固定,分为定点数、浮点数二种类型。 1)定点整数 是指小数点隐含固定在整个数值的最右,符号位右边所有的位数表示的是一个整数,最小数为1。,2) 定点小数是指小数点隐含固定在最高数据位的左边,最大数为0,3)浮点数:是指小数点可浮动的数
8、据。,定点小数,任意一个十进制数N可以写成:,一个任意进制数N可以写成:,其中:N为浮点数;S为浮点的尾数(纯小数)P为阶码(浮点指数,整数);R为基数(常数,一般为2、8、10、16),例: X=11001.11 (二进制真值) 浮点表示为: 0.1100111 2101(二进制),在计算机中,机器数也有不同的表示方法,通常用原码、反码和补码三种方式表示。,4、原码、反码和补码,即 X原=符号位+|X|,1)原码,例如: X= -1001,则 X原=11001,X= +1001,则 X原=01001,数值0, 有+0、-0 两种表示: 0原=00000; -0原=10000,原码表示简单,但
9、是加减法运算复杂。,2)反码,X1=+1001010 X1原=X1反=01001010 X2=-1010110 X2原=11010110 X2反=10101001,当X为正数, X反=X原;,当X为负数时保持X原符号位不变,将数值部分取反。,例:,数值0, 反码的表示: +0反=00000; -0反=11111,3)补码表示法,X=+1001010, X原=X反=X补=01001010 Y=-1010110,Y原=11010110, Y反=10101001 Y补=Y反+1=10101010,当X为正数, X反=X原;,当X为负数, 保持X原符号位不变,将数值部分取反。然后在最低位加1, 即可得
10、-X补。,例如:,数值0, 补码的表示: +0补=-0补=0.0000,原码和补码、反码之间相互转换的实现,对于正数,X原码=X反码=X补码,对于负数,原码,反码,补码,五、多媒体的基本概念,多媒体 指文、图、声、像等多种信息媒体同计算机融合一起形成的信息传播媒体。,2.多媒体数据的特点 1)数据量非常大,数据库中的组织和存储变得复杂。 2)数据处理复杂。 3)多媒体改变了数据库的接口,操纵形式,查询机制等。,3.多媒体计算机(MPC)具有多媒体功能的计算机叫多媒体PC,简称MPC.现代MPC的主要硬件配置必须包括CD-ROM、音频和视频卡,这三方面既是构成现代MPC的重要组成部分,也是衡量一台MPC功能强弱的基本标志。,无失真压缩编码 利用数据的冗余进行压缩,可完全恢复原始数据而不引入任何失真。有失真压缩编码 利用了人类视觉和听觉器官对图像或声音中某些频率成分不敏感的特性,允许在压缩过程中损失一定信息。,1)数据压缩方法分类,4. 多媒体数据压缩技术,2)压缩编码的国际标准 静止图像压缩标准 JPEG:对静止图象数据压缩 应用:CD-ROM、彩图传真、图文档管理等。动态图像压缩标准 MPEG:对音频、视频数据压缩。 (标准MPEG-1、MPEG-2、MPEG-4),