1、1,第2讲_0、1编码与数字化,2,内容提要,2.1 从八卦图到0、1编码 2.2 数值数据的0、1编码 2.3 西文字符的0、1编码 2.4 汉字的0、1编码 2.5 图像的0、1编码 2.6 声音的0、1编码 2.7 指令的0、1编码,3,2.1 从八卦图到0、1编码,1. 八卦图 2. Leibniz的二进制 3. 基于二进制的现代计算机 4. 二进制位、字长和字节 5. 奇偶校验0、1码的错误检测,4,当今时代最流行的名词信息化,信息化=数字化+网络化,网络化:提供了一个虚拟宇宙虚拟时空。,数字化:将现实中的事物变成虚拟宇宙中的事物数字。,5,数字化的实质,用有限个符号表示现实世界中的
2、事物。电子商务 符号经济学 ,6,人类使用过的符号体系,各种数字系列各种文字系列,7,数字系列,罗马数字 巴比论数字 阿拉伯印度数字 中国数字,8,罗马数字 (基于十进制的加权计数法),罗马计数制使用的符号,典型数值的罗马数字表示,32, 64, 128, 256, 512, 1024 的罗马数字依次是: XXXII LXIV CXXVIII CCLVI DXII MXXIV,9,古巴比论计数法 十进/六十进制,计数符号:,没有零。同一个符号 可以代表1或60。例如,代表:260=120。,代表:2603+3602+41=402841,说明:,10,阿拉伯印度数字,西阿拉伯:東阿拉伯:,11,
3、中国数字,汉字数字符号 算筹数字符号 八卦数字符号,12,汉字数字,一、二、三、四、五、六、七、八、九、十、百、千、万、亿、兆、京 壹、贰、叁、肆、伍、陸、柒、捌、玖、拾、佰、仟、万、亿、兆、京,十 进:十十为百,十百为千,十千为万,十万为亿,十亿为兆,十兆为京。即1010百,10100千,101000萬,1010000億,10100000兆 万万(亿)进:万万为亿,亿亿为兆,亿兆为京。即1000010000億,1000010000100002兆,1000010000100004京。 自乘进位:万万为亿,亿亿为兆,兆兆为京。 即100002億,(100002)2兆,(100002)22京,13
4、,算筹计数符号(五升十进制),5428 32591 60837924,2356 + 4789 = 7145,14,八卦图,0和1能够组成复杂的信息,几千年之前中国人就解决了这个问题。,(a)八卦图,15,八卦计数法,北宋哲学家邵雍说:“一变而二,二变而四,三变而八,四变而十有六,五变而三十有二,六变而六十有四”。 即: 使用1个符号,有2种组合(和-),即两仪; 使用2个符号,有4种组合(、-、),即四象; 使用3个符号,有8种组合,即八卦; 使用4个符号,有16种组合; 使用5个符号,只有32种组合; 使用6个符号,只有64种组合。即邵雍64卦图。,16,邵雍的六十四卦图,“一变而二,二变而
5、四,三变而八,四变而十有六,五变而三十有二,六变而六十有四”使用的符号越多,可以有的组合就越多。如此组合,没有不可以代表的事物。,17,Leibniz的二进制,八卦图大约在1658年以前就传到了欧洲。 1658年出版的卫匡国的中国上古史,1660年出版的斯比塞尔的中国文史评析中都有相关的记载和介绍。 1679年3月15日,莱布尼茨题为“二进位算术”的论文,对二进位制进行了相当充分的讨论,并与十进位制进行了充分的比较。,18,Leibniz研究 二进制的手稿,19,基于二进制的现代计算机,1945年3月Neumann和他的小组提出了电子数字计算机应当采用二进制工作方式 。 在电气技术条件下,使用
6、二进制有如下好处: (1)制作方便。 (2)经济。 (3)运算规则简单 。,20,二进制运算规则, 加法规则:“逢2进1” 0 + 0 = 0 1 + 0 = 0 + 1 = 1 1 + 1 = 10 减法规则:“借1当2” 0 0 = 0 1 0 = 1 1 1 = 0 10 1 = 1 乘法规则 0 0 = 0 1 0 = 0 1 = 0 1 1 = 1 运算器中最核心的部件是加法器,21,二进制位,二进制的一个位称为一个“二进制数字”(binary digit),简称比特bit,简写为b。 用1个比特(也可写成1bit或1b)可以表示两种事物或状态; 用2个比特可以表示4种事物或状态;
7、用3个比特可以表示8种事物或状态; ,22,课堂练习,1. 如何对下面的问题进行0、1编码? (1)每周7天; (2)每年12个月; (3)一月中的每天; (4)全班每个同学; (5)26个英文字母; (6)居民身份证。,23,字长和字节,字长是计算机CPU一次能并行处理的二进制位数。它直接反映了一台计算机的计算精度,并且字长越大计算机的处理数据的速度就越快。为适应不同的要求及协调运算精度和硬件造价间的关系,大多数计算机均支持变字长运算,即支持实现半字长、全字长(或单字长)和双倍字长运算。 字长是一个不固定的单位。为了能统一地进行数据存储和传输的度量,人们使用8b作为二进制数据的度量单位,并将
8、之称为字节(Byte,或缩写为B)。,24,奇偶校验0、1码的错误检测,25,奇偶校验0、1码的错误检测,对于传输差错的基本应对策略有3个: 一是提高元器件的质量; 二是采用一定的技术检测出错误; 三是采取一些技术措施改正错误或重新传输。 其中与编码有关的是检测错误。最简单的是奇偶校验(odd-even check)。 奇偶校验就是在要传输的数据之外再增加一位,使实际传输的数据中的1的个数总保持奇数或偶数。所增加的位称为冗余位。,26,奇偶校验0、1码的错误检测,27,课堂讨论,1. 能不使用冗余码就检测出传输错误吗?,28,2.2 数值数据的0、1编码,1. 二进制的基本概念 2. 十进制数
9、与二进制数之间的转换 3. 十六进制编码 4. 符号的0、1编码 5. 实数的0、1编码,29,二进制的基本概念,十进制特点: (1)采用0,1,2,3,4,5,6,7,8,9十个符号表示数; (2) “逢十进一” ; (3)十进制数从小数点往左,分别为十位、百位、千位 ,从小数点向右,分别位十分位、百分位、千分位 。 一个数字m,在某一个位置i上时,其值为m10i。10i称为i位权。,30,二进制的基本概念,二进制特点: (1)只能用两个符号表示数 ; (2)“逢二进一” ; (3)二进制数从小数点往左,各位的位权分别为20、21、22,即1、2、4等;小数点往右各位的位权分别为2-1、2-
10、2,即0.5、0.25 等。,31,课堂练习,1. 强记常用二进制的位权值。,32,二十 (BD) 进制转换,规则:将1所在的位上的位权值相加。,33,整数十二转换,规则:从足够的位权值开始,连续减去各个位权值:够则减该位取1,不够则不减该位取0;直到减完最后一个位权值1。 例2.2.2 158D ?B 解:考虑158在128与256之间,则先减128,该位取1,差为30;减64,不足,该位取0;再减32,不足,取0;再减16,够减,取1,差为14;减8。够减取1,差为6;减4,够取1,差为2;减2,够取1,差为0;减1,不够取0,结束。,34,上述过程如图,35,小数十二进制转换,规则:从小
11、数点=开始连续减各小数位的位权值,够则减该位取1,不够则不减该位取0,直到减为0或到要求的位数。 例2.2.3 0.24D ?B,到小数点后4位。,36,计算过程如图,37,十六进制编码,十六进制记数符为:0,1,2,3,4,5,6,7,8,9,A(a),B(b),C(c),D(d),E(e),F(f) 。 将二进制数由小数点起,向两侧分别以每4位划一组(最高位与最低位不足4位以0补)。每一组便为一个十六进制数。,38,例题,39,符号的0、1编码,一般用数的最高有效位(Most Significant Bit,MSB)表示数的正负。 MSB0 表示正数,如+1011表示为01011; MSB
12、1 表示负数,如-1011表示为11011。 没有符号位的数,称为无符号数。 同样字长,无符号数的最大值比有符号数要大1倍。,40,实数的0、1编码,实数就是带小数点的数,可以表示成指数形式。 一个任意二进制数N可以表示为 : N2EM E为数N的阶码;M为数N的有效数字,称为尾数。,41,浮点数的机内表示,其中,Ef,S分别称为阶码E和尾数M的符号位,它们一般占1b。 使用这种格式的关键是规定好总的字长和每部分的长度。,42,IEEE 754,32b 符号1,阶码8,尾数23 64b 1, 11, 52 80 1, 15, 64,43,课堂练习,1. 什么叫浮点数?,44,2.3 西文字符的
13、0、1编码,1. ASCII码 2. 字符的输出,45,ASCII码,西文中最基本、应用最多的字符共计87 个。 87位于64128之间,需要7b的长度,再用最高位b7作为奇偶校验位,正好是一个字节。 1967年美国国家标准学会(American National Standards Institute,ANSI)提出一套编码方案作为数据传输的标准码,称为美国信息交换标准码(America Standard Codefor for Information Interchange,ASCII)。,46,ASCII码(7位码)字符表,47,字符的输出,不同字体的字符都是一个图形。 存储这个图形的方
14、法是在一个栅格中用方块组成的点阵画出一个字符的图形称为字模。 字符“A”的字模:,48,课堂作业,1. 试画出1616点阵组成的字符“A”。 2. 在ASCII表中,哪个值大? (1)大写字母和小写字母。 (2)数字和字母。,49,2.4 汉字的0、1编码,1. 几种常用的汉字编码方案 2. 汉字的输入汉字外码 3. 汉字的字模 4. 汉字系统的工作过程,50,几种常用的汉字编码方案,(1)GB2312-1980和GB2312-1990 (2)BIG5编 (3)GBK编码 (4)Unicode编码(Universal Multiple Octet Coded Character Set) (5
15、)GB 18030-2000 以上几种编码都是机内码。,51,汉字的输入汉字外码,常见的输入法 : (1)按汉字的排列顺序形成的编码(流水码):如区位码; (2)按汉字的读音形成的编码(音码):如全拼、简拼、双拼等; (3)按汉字的字形形成的编码(形码):如五笔字型、郑码等; (4)按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC。,52,汉字的字模,汉字字模的原理与西文字符的字模基本相同 。 一个2424点阵的汉字字模示例:,53,汉字系统的工作过程,54,课堂讨论,1. 为什么汉字要有输入码(外码)、机内码和字库?与西文有何不同? 2. 现在执行的强制性国家汉字编码标准是什么?
16、,55,2.5 图像的0、1编码,1. 位图图像的生成 2. 位图图像的存储 3. 图像的显示,56,计算机中处理图像的两种方法,(1)矢量图(vector graphice)法:用一些基本的几何元素(直线、弧线、圆、矩形、等)以及位置、维数等描述图像,并用一组指令表述; (2)位图(bitmapped graphics)法:用点阵描述图像,并用一组0、1码数据描述。,57,位图图像的生成,位图图像通过离散化、采样和量化得到。 (1)图像的离散化:,58,位图图像的生成,(2)采样与量化 采样(sampling)就是在每个小块中取它的颜色参数。 将每个采样点的每个分量进行0、1编码,就称为量化
17、。,59,位图图像的存储,一幅数字图像,常用一个文件存储,存储空间为: 文件字节数=(位图宽度位图高度位图颜色深度)/8 例2.5.1 计算一幅640480图像按照下列颜色深度存储时的存储空间。 灰度图。 真彩色图。,60,图像的显示,显示器的屏幕分辨率:该屏幕的水平与垂直方向的像素点个数的乘积。 一个屏幕像素点对应一个图像像素点。 当图像分辨率与屏幕分辨率相同时,一幅图象正好布满屏幕; 当图像分辨率大于屏幕分辨率时,只能显示出一幅图象的一部分; 当图像分辨率小于屏幕分辨率时,图象只能占据屏幕的一部分。,61,课堂讨论,1. 如何保证数字图像的质量? 2. 一幅图像的大小为320240,屏幕分
18、辨率为640480,该图象在屏幕上的显示情况如何?,62,2.6 声音的0、1编码,1. 声音的0、1编码过程 2. 两个技术参数,63,声音的0、1编码过程,(1)采样。采样就是每隔一定的时间,测取连续波上的一个振幅值。 (2)量化。量化就是用一个二进制尺子计量采样得到的每个脉冲。,64,声音的0、1编码过程,65,两个技术参数,将一个连续波(也成模拟信号)转化为数字信号的过程通常称为模数转换(analog-to-digital,A/D)。 在A/D转换过程中,有两个基本参数: 采样频率; 量化精度。,66,两个技术参数,(1)采样频率 采样频率,即一秒钟内的采样次数,它反映了采样点之间的间
19、隔大小。 (2)测量精度 测量精度是样本在垂直方向的精度,是样本的量化等级,它通过对波形垂直方向的等分而实现。,67,课堂讨论,1. 模数转换有哪两个环节?哪两个重要参数?,68,2.7 指令的0、1编码,指令分为两部分:操作码部分和操作数部分。 操作码用来指出要求CPU执行什么操作 ; 数据部分指出要对哪些个数据进行操作。 操作数部分通常要描述3个地址:对两个地址中的数据进行操作、以及运算后把结果放到哪个存储空间中。 一条指令字的格式 :,69,指令的0、1编码,除了3地址指令外,指令还可以有如下形式: 2地址指令:将计算结果放在一个操作数地址中,可以节省一个结果数据存储空间。 1地址指令:在2地址指令的基础上,一个操作数来自CPU中一个特定的寄存器(累加器),结果又放回累加器,只须从存储器取一个操作数。,70,课堂作业,1. 一个CPU最大寻址空间为256MB(1M=220=10241024),可以执行156种指令。请按2地址结构设计该CPU的指令格式。,71,课外作业,1. 什么叫数字化? 2. 用0、1编码不能表示哪些信息?,