1、第3章 汉字信息处理与汉字输入法,目录: 3.1计算机的数制与编码 3.2文字信息的计算机处理过程 3.3微机汉字输入法的使用,2,3.1 计算机的数制与编码,3.1.1 数制 3.1.2 ASCII码,3,3.1.1 数制,数制指的是表示数的方法和规则。 计算机中常用的进制及其表示方法 不同进制间的转换,返回本节,4,计算机中常用的进制及其表示方法,十进位计数制 二进位计数制 八进位计数制 十六进位计数制,返回本章,5,返回本节,(1) 十进位计数制 (用字母D表示),十进位计数制(简称十进制)使用十个数码(0,1,2,3,4,5,6,7,8,9)表示数,低位向高位进位的规则是“逢十进一”。
2、 十进制的基数为10。一个十进制整数可用多项式展开。例如,976可以写成:976=9102 +7101 +6100 写成通式,一个十进制整数表示的数值是:,返回本章,6,二进位计数制(简称二进制)的基数为2,使用两个数码(0、1)表示数。低位向高位进位的规则是“逢二进一”。 例:(10110 )2 (124+023+122+121+020)10 写成通式,一个二进制整数表示的数值为:,(2) 二进位计数制 (用字母B表示),返回本节,返回本章,7,八进位计数制(简称八进制)的基数为8,使用8个数码(0,1,2,3,4,5,6,7)表示数。低位向高位进位的规则是“逢八进一”。 例:(1340)8
3、(183+382+481+080)10 写成通式,一个八进制整数表示的数值为:,(3) 八进位计数制 (用字母O表示),返回本节,返回本章,8,简称十六进制,基数为16,使用16个数码: 09,AF表示数。这里借用AF作为数码,分别代表十进制中的1015。低位向高位进位的规则是“逢十六进一”。 例:( 3A4F )16(3163+10162+4161+15160)10 写成通式,一个十六进制整数表示的数值为:,(4) 十六进位计数制 (用字母H表示),返回本节,返回本章,返回本章,9,不同进制之间的转换,R进制转换为十进制 十进制转换为R进制 二进制与八进制互相转换 二进制与十六进制互相转换
4、八进制与十六进制互相转换,返回本章,10,R进制转换为十进制,R进制指的是二、八、十六进制的基数 转换规则为按权展开。即以R为底,以数码所在位数为幂,乘上各数码的值之和就是一个R进制相对应的十进制的值。 公式如下:,返回本节,返回本章,11,举例:二进制转换为十进制,二进制数要转换成十进制数非常简单,只需将每一位数字乘以它的权2n,再以十进制的方法相加就可以得到它的十进制的值(注意,小数点左侧相邻位的权为20,从右向左,每移一位,幂次加1)。,【例1】(10110.011)B =124+023+122+121+020+02-1 +12-2 +12-3 =(22.375)D,返回本章,43210
5、,-1 -2 -3,返回本节,12,方法 举例 十进制转换为二进制 十进制转换为八进制 十进制转换为十六进制,十进制转换为R进制,返回本节,返回本章,13,十进制数据转换成R进制采用的是倒除法,即“除R取余”的方法。具体过程如下: (1)将十进制数除R ,保存余数。 (2)若商为0,则进行第三步,否则,用商代替原十进制数,重复第1步。 (3)将所有的余数找出,最后得到的余数作为最高位,最先得出的余数作为最低位,由各余数依次排列而成的新的数据就是转换成R进制的结果。,十进制转换为R进制的方法,返回本节,返回小节,返回本章,14,采用 “除2取余”的方法。具体过程如下: (1)将十进制数除2,保存
6、余数。 (2)若商为0,则进行第三步,否则,用商代替原十进制数,重复第1步。 (3)将所有的余数找出,最后得到的余数作为最高位,最先得出的余数作为最低位,由各余数依次排列而成的新的数据就是转换成二进制的结果。,举例:十进制转换为二进制,返回本章,返回本节,返回小节,15,【例2】将(236)D转换成二进制。,(236)D(11101100)B,返回本章,返回本节,返回小节,转换过程如图所示。,16,【例4】将(236.34)D转换成二进制。,2 3 6,2,1 1 8, ,0,2, ,0, ,1,(236.34)D=(1110110.0101)B,举例:带小数的十进制转换为二进制,方法:整数部
7、分照前采用“除R取余法”;小数部分则采用“乘R取整法”。,整数部分:,5 9,2,2 9,2,1 4,2, ,1,7,2, ,0,3,2, ,1,1,2, ,1,0, ,1,0.34,2,0.68, ,0,2,1.36, ,1,2,0.72, ,0,1.44, ,1,2,小数部分:,返回本章,返回本节,返回小节,17,【例3】将(236)D转换成八进制。转换过程如图所示。,2 3 6,8,2 9, ,4,8,3, ,5,8, ,3,0,(236)D=(354)O,举例:十进制转换为八进制,返回本章,返回本节,返回小节,18,【例4】将(236)D转换成十六进制。转换过程如图所示。,2 3 6,
8、16,1 4, ,12,16,0, ,14,(236)D=(EC)H,C,E,举例:十进制转换为十六进制,返回本章,返回本节,返回小节,19,方法:由于8=23,所以在将二进制数转换成八进制数时,从最右侧开始,每3位二进制数划为一组,用一位八进制数代替,也称为“三位一并”;八进制数转换成二进制数时正好相反,一位八进制数用3位二进制数来替换,也称“一分为三”。 转换关系如下:,二进制数与八进制数的相互转换,返回本章,返回本节,返回小节,20,举例:二进制数与八进制数的相互转换,2、把二进制1100110.10101转换为八进制:,1、把八进制数(123.37)8转换为二进制:,1 2 3 . 3
9、 7,001 010 011 . 011 111,(123.37)8(1010011.011111)2,1 4 6 . 5 2,001 100 110 .,( 1100110.10101 )2(146.52)8,101 010,返回本章,返回本节,返回小节,21,二进制数与十六进制数的相互转换,方法:由于16=24,所以在将二进制数转换成十六进制数时,从最右侧开始,每四位二进制数划为一组,用一位十六进制数代替,也称为“四位一并法”;十六进制数转换成二进制数时正好相反,一位十六进制数用四位二进制数来替换,也称“一分为四法”。 转换关系如下:,返回本章,返回本节,返回小节,22,举例:二进制数与十
10、六进制数的相互转换,2、把二进制1101010110.10101转换为十六进制:,1、把十六进制数(A76.E9)H转换为二进制:,A 7 6 . E 9,1010,.,0011 0101 0110 .,( 1101010110.10101 )B(356.A8)H,1010 1000,0111,0110,1110,( A76.E9 )H(101001110110.11101001)B,1001,.,3,5,6,A,8,返回本章,返回本节,返回小节,23,八进制与十六进制数相互转换时,可以分成两步完成:将待转换的八进制或十六进制数转换成二进制,然后再将二进制数转换成十六进制或八进制。,八进制与十
11、六进制的相互转换,返回本章,返回本节,返回小节,24,3.1.2 ASCII码,目前在国际上广泛采用“美国信息交换标准代码”表示英文字符、标点符号和作为符号使用的阿拉伯数字等。其全称为 American Standard Code of Information Interchange,简称ASCII码。 这种编码方法用七位二进制码表示一个字符(见附录B),七位二进制码不够一个字节,为了计算机存储和处理方便,实际使用时每个字符在计算机中用一个字节表示,字节的最高位(左)位为0。这种在ASCII码最高位前添0形成的字节就是ASCII码的机内码。,25,附录表 7位ASCII码表,26,返回本节目录
12、,27,3.2 计算机的基本运算,3.2.1 四则运算 3.2.2 基本逻辑运算,28,3.2.1 四则运算,二进制数的加法运算规则: 000 101 011 1110 二进制数的乘法运算规则: 000 100 010 111,29,3.2.2 基本逻辑运算,1. 逻辑“与”运算规则 通常用“AND”或“”表示逻辑“与”运算。如A AND B或AB。A、B的取值为0或1。 逻辑“与”运算规则为: 0 AND 00 0 AND 10, 1 AND 00 1 AND 11 或表示为: 000,010,100,111,30,2. 逻辑“或”运算规则 通常用“OR”或“+”表示逻辑“或”运算。如A O
13、R B或A+B。A、B的取值为0或1。 逻辑“或”运算规则为: 0 OR 00 0 OR 11, 1 OR 01 1 OR 11 或表示为: 0+00,0+11,1+01,1+11,31,3. 逻辑“非”运算规则 通常用“NOT”或“”表示逻辑“非”运算。如NOT A或。 逻辑“非”运算规则为: NOT 01 NOT 10 或表示为: -00,010,100,111,返回本章,32,二进制的加法运算规则如下:000;101;011;1110(被加数和加数 为1,结果本位为0,按逢二进一规则向高位进位1)。 【例3-10】 求二进制数(1101)2和(1011)2之和。运算过程如下:即(1101
14、)2(1011)2(11000)2 ((13)10(11)10(24)10),33,二进制的减法运算规则如下:000;100;011(被减数为0,减数为1,结果本 位为1;因为要向高位借位,本位被减数变为1011,所以 01为1111);110。【例3-11】 求二进制数(11101)2和(1011)2之差。运算过程如下:即(11101)2(1011)2(10010)2 (29)10(11)10(18)10),34,二进制的乘法运算规则如下:000;100;010;111。【例3-12】 求二进制数(1101)2和(1110)2之积。 运算过程如下:即(1101)2(1110)2(101101
15、10)2 ((13)10(14)10(182)10),35,二进制的除法运算规则如下:000;010 (10无意义);111。【例3-13】 求二进制数(1001110)2和(110)2之商。 运算过程如下:即(1001110)2(110)2(1101)2 (78)10(6)10(13)10),36,(2)基本逻辑运算 在形式逻辑中,任何复杂的逻辑运算都可以由三种基本逻 辑运算来实现,即逻辑与(AND)、逻辑或(OR)、逻辑非 (NOT),简称与、或、非。逻辑变量和运算结果只有“真 (True)”、“假(False)”两个值,在计算机中可用“0”表示 “假”,用“1”表示“真”。设有两个逻辑变
16、量A和B,A、B的取值只能为0或1,逻辑运 算规则如下: 逻辑“与”运算规则“与”运算又称逻辑乘,通常用符号“AND”或“.”表示,如A AND B或A.B。 逻辑“与”的运算规则为0 AND 0=0 0 AND 1=0 1 AND 0=0 1 AND 1=1 或表示为0.0=0 0.1=0 1.0=0 1.1=1,37, 逻辑“或”运算规则“或”运算又称逻辑加,通常用符号“OR”或“”表示,如A OR B或AB。逻辑“或”的运算规则为0 OR 00 0 OR 11 1 OR 01 1 OR 11 或表示为0 00 0 11 1 01 1 11逻辑“或”形式上类似于二进制数的加法,但语义不同。
17、上 述规则表示,只有两个逻辑变量都为假时,结果才为假,否则 结果为真。 逻辑“非”运算规则“非”运算通常用符号“NOT”或“”表示。逻辑“非”是一元 运算,即参与运算的数只有一个,对逻辑变量A,逻辑“非”运 算可表示为NOT A或。逻辑“非”的运算规则为NOT 01 NOT 10 或表示为,38,上述规则表示,当逻辑变量为真时,结果为假;反之,结 果为真。基本逻辑运算真值表,39,ASCII码表中的字符排序是有规律的,如数码的ASCII码值 小于大写英文字母的ASCII码值,大写英文字母的ASCII码值又 小于小写的英文字母的ASCII码值,而数码或英文字母的ASCII 码则按数字或字母顺序由
18、小到大排序等。计算机对非数值数据 进行排序时,是根据字符的ASCII码值比较其大小的。 3.1.3 汉字编码ASCII码并不包括汉字的编码,为了使计算机能够处理 汉字,就要解决汉字的编码问题。 1.国标码1981年5月,国家标准总局颁布了信息交换用汉字编码 字符集,即GB 231280汉字编码国家标准(见附录3)。 该标准给出的汉字编码简称国标码。,40,国标码收进的字符共有7445个,包括非汉字字符和汉字字 符,非汉字字符有标点符号、数学符号、序号、数字、英文大 小写字母、俄文字母、希腊字母、罗马字母、日文片假名、汉 语拼音符号和其他一些常用符号等;汉字字符中一级汉字3755 个,二级汉字3
19、008个,共计6763个。国标码采用双七位二进制码表示一个汉字。在GB 2312 80代码表中纵向分为94行,横向分为 94列,行和列分别用七 位二进制码表示,其值都从0100001到1111110,第一个七位表 示汉字所在的行,第二个七位表示汉字所在的列,如表下所示。GB 231280代码表(局部),41,由上表可知,汉字“阿”的国标码为“01100000100010”、 汉字“宝”的国标码为“01100010100110”。由于二进制形式太 长,国标码通常用十六进制表示,例如:2. 区位码在GB 231280代码表中,将94行和94列分别用二位十进制 数编号,均从01到94,行编号称为区号
20、,列编号称为位号,则 有94个区和94个列。将每个汉字(或符号)的区号和位号连起 来就组成这个汉字(或符号)的区位码。例如: 汉 字 区号 位号 区位码阿 16 02 1602宝 17 06 1706,42,区位码与国标码有着简单的对应关系:将区位码的区号和位号分别转换为对应的十六进制数,再 加上十六进制数2020H(H表示2020为十六进制数),就得到对 应的国标码。例如,“阿”的区位码是1602,分别将区号和位号 转换成对应的十六进制数得1002H,再加上2020H就得到“阿”的 国标码为3022H。 3. 机内码国标码是双七位二进制码,不是字节的倍数,不便于计算 机存储和处理,因此要将国
21、标码转换成在计算机内部实际表示 汉字的代码,即机内码。目前多数微机汉字系统的机内码都是以国标码的双七位二 进制码为基础,在第一、二个七位二进制码最高位(左)前分 别添加数码“1”,构成完整的双字节,即以两个字节表示一个 汉字(或符号)。,43,汉字机内码与国标码有很简单的对应关系:将四位十六进制的国标码加上8080H,就得到对应的机内 码。如“阿”字的国标码为3022H,加上8080H就得到其对应的机 内码为B0A2H。8080H对应的二进制数是1000000010000000,将四位十 六进制的国标码加上8080H,恰好等于在国标码的双七位二进 制码的第一、二个七位二进制码最高位(左)前分别
22、添加数码 “1”,保证机内码的每个字节的首位均为1。将B0A2H转换为二 进制数为1011000010100010,这就是计算机内实际使用的汉字 “阿”的机内码的二进制形式。,44,3.2 文字信息的计算机处理过程计算机处理文字的过程包括信息输入、信息加工和信息 输出。 3.2.1 文字信息的输入1. 键盘输入计算机的键盘原本是为英文输入设计的,一个键对应一个字 符或标点符号。击键一次键盘的译码电路就产生该键代表的字 符或标点符号的ASCII码,并输入到计算机的内存中。因为英文键盘按键的数目远远少于汉字的字符数,所以需要 用若干个健的组合来表示一个汉字。这种键的组合称为“汉字 输入编码”。,4
23、5,尽管汉字编码输入方案种类繁多,但是归纳起来可分为下 面几类:(1)数码数码就是用数字对汉字进行的编码。这是没有重码的编 码,如区位码,电报码等。(2)形码形码就是根据汉字字形、结构进行的编码。如五笔字型码、 徐码、郑码、表形码等。(3)音码音码就是根据汉字的拼音进行的编码。如全拼、双拼、智 能ABC、微软拼音等。 (4)音形码音形码就是根据汉字的拼音、字形进行的综合编码。如自 然码、认知码等。,46,2. 其他输入设备除了常用键盘输入文字信息外,其他输入方法主要有语音 输入和手写输入。语音输入通过发声来输入汉字,计算机需要配备声卡、麦 克风和语音输入软件。但这种输入技术目前还不够成熟。手写
24、 输入通过在特制的手写设备(如手写板)上书写文字来输入汉 字。这种输入技术已经成熟,相应的设备已商品化,比较适合 不会键盘输入、输入字数不多、对速度要求不高的用户使用。3.2.2 文字信息的加工文字信息的加工指的是对输入文字进行编辑、排版。如 增、删、改文本,设置文字的字体、字号,段落设置和版面布 局设计等。所有这些工作必须使用专门的文字处理软件才能完 成。,47,3.2.3 文字信息的输出所谓点阵就是一些相关点的集合,是把一个汉字看成一个 二维图形,把笔画离散化,用有笔画的点和无笔画的点的组合 来描述一个汉字。 描述一个汉字的字形点阵信息的若干个二进制代码串就组 成该汉字的“字模”,所有汉字
25、和符号的“字模”就组成了汉字 “字模库”,简称“字库”。汉字点阵类型和参数,48,点阵数越多,输出的汉字就越精美,但占用的字节数就越大。一般地,简易型的1616的点阵也可较好地显示一个汉字。 若要以1616的点阵的字库存储包括一、二级汉字在内的近8000个常用汉字和符号,需要约240KB的存储空间,2424点阵的汉字库需要580KB,精密型点阵的字库,占用的存储空间就更大了。 在计算机中安装字库有两种方法:即硬字库和软字库方法。1. 文字的显示输出 字符显示原理如下图所示:,49,2. 文字的打印输出汉字打印的工作过程如下图所示:3.3 微机汉字输入法的使用 3.3.1 汉字输入法的添加、安装
26、与删除1. 语言栏启动计算机后,在任务栏的右端 有一个包含输入法指示器的语言栏, 如右图所示。,50,2. 汉字输入法的添加添加操作系统自身提供的其他汉字输入法的步骤如下: 右击语言栏,在弹出的快捷菜单中选择“设置”选项,或 选择“我的电脑”“控制面板”“区域和语言选项”,在弹出的 “区域和语言选项”对话框中选择“语言”选项卡,单击其中的 “详细信息”按钮,均会弹出“文字服务和输入语言”对话框,如 下图所示。,51, 在该对话框中单击“添加”按钮,弹出“添加输入语言”对 话框,如下图所示。 在该对话框的“输入语言”下拉列表框中选择“中文(中 国)”选项,在“键盘布局/输入法”下拉列表中选择要添
27、加的中 文输入法,如“中文(简体)-双拼”,单击“确定”按钮,则在 “文字服务和输入语言”对话框的“已安装的服务”列表中添加了 所选择的中文输入法。 单击“文字服务和输入语言”对话框的“确定”按钮,此时 用鼠标单击任务栏的输入法指示器,在弹出的菜单中可看到新 添加的中文输入法。,52,3. 汉字输入法的安装如果用户需要使用操作系统自身没有提供的汉字输入法, 如“王码五笔型输入法86/98版”等,可购买或上网下载这些软 件,在用户计算机上运行安装程序并按提示操作即可把它们安 装进去。4. 删除输入法删除操作系统自身提供的汉字输入法的方法如下:在“文字服务和输入语言”对话框的“已安装的服务”列表中
28、 选定要删除的输入法,单击“删除”按钮,则该输入法从“已安 装的服务”列表中删除;再单击“确定”按钮,则该输入法从输 入法指示器的菜单中删除。需注意的是,被“删除”的输入法并 不从操作系统中删除,而是重新放回“添加输入语言”对话框的 “键盘布局/输入法”下拉列表框中,需要时用户可用“汉字输入 法的添加”方法重新添加使用。,53,删除操作系统自身没有提供的另行安装的汉字输入法的 方法如下:除了可用上述的删除操作系统自身提供的汉字输入法的方 法外,有的输入法软件还可通过任务栏的“开始”“所有程 序”,在弹出的菜单中逐级找到该软件的卸载项或通过“控制面 板”“添加或删除程序”彻底删除。3.3.2 汉
29、字输入法的选择与切换1. 输入法选择选择某一种汉字输入法,例如王码五笔型输入法86版,可单 击语言栏上的输入法指示器,在弹出的输入法菜单中单击该输 入法选项,该输入法选项前会出现对号“”并在任务栏左侧出 现“五笔型”输入法状态栏,如下图所示,此时可以用该输入法 输入汉字。,54,输入法菜单及输入法状态栏 2. 输入法切换 中英文切换按钮。单击“中英文切换”按钮,显示“A”时表 示处于英文输入状态,显示图案时表示处于中文输入状态,两 种输入状态可根据需要切换。 输入法名称框。输入法名称框主要用来显示当前使用的 汉字输入法名称,通过单击此框,有些输入法可以改变拼法, 如智能ABC输入法等。,55,
30、 全角/半角切换按钮。单击“全角/半角切换”按钮,显示 “全月”时为全角状态,无论汉字还是英文字符,一律用两字节 表示;显示“半月”时为半角状态,汉字用两字节表示,英文字 符用一字节表示,所以英文全角字符显示宽度比英文半角字符 大一倍。 中英文标点切换按钮。单击“中英文标点切换”按钮,显 示中文句号(小圆圈)和空心逗号时表示处于中文标点符号状 态,此时无论是在全角或半角状态下输入的标点符号均为中文 标点符号,并且均占两个半角字符宽度;显示英文句号(小圆 点)和实心逗号时表示处于英文标点符号状态,此时无论是在 全角或半角状态下输入的标点符号均为英文标点符号,但全角 状态下的英文标点符号用两字节表
31、示,半角状态下的英文标点 符号则用一字节表示,即前者的显示宽度为后者的两倍。,56,在中文标点符号状态下,键盘按键与中文标点符号的对应 关系如下表所示。中文标点符号与按键的关系,57, 软键盘按钮。单击“软键盘”按钮可打开软键盘,单击软 键盘上的键可代替手指在实际键盘中的按键操作;可利用软键 盘输入外文字母或特殊符号,方法是:右键单击软键盘按钮, 弹出包含希腊字母、俄文字母、日文平假名和片假名、数学符 号、单位符号和一些特殊符号等选项的菜单,单击所需的选 项,打开相应的软键盘,单击软键盘中所需的字母或符号即可。使用快捷键切换输入法的方法如下:组合键“CtrlSpace(空格键)”:中英文输入状
32、态之间 切换。组合键“CtrlShift”:在各种输入法之间轮流切换。需 注意的是,此操作在有的操作系统中默认设置为按组合键“Alt Shift”。,58,3.3.3 编码框与词语选择框当输入汉字的编码时该编码会显示在一长条形编码框中,如果输入有错可以按退格键删除或按Esc键取消输入的编码,等待重新输入。如果有重码,就出现词语选择框,供用户选择需要的单字或词组,如果所需单字或词组排列在第一位,可按空格键或数字键“1”输入该单字或词组,否则按对应的数字键输入。 3.3.4 输入法设置利用中文Windows XP系统提供的“输入法设置”功能,用户可更加方便快捷输入汉字,右单击“输入法状态栏”中除“
33、软键盘”以外的任何地方,在弹出的快捷菜单中选择“设置”选项,或在 “文字服务和输入语言”对话框的“已安装的服务”列表中选择任一种汉字输入法后单击“属性”按钮,均会出现“输入法设置”对话框,如下图所示。,59,1. 词语联想系统默认选中该项,即默认有词语联想功能,当输入单个汉 字或词组时接着会把联想的词语继续显示在词语选择框中,供 进一步选用,如果取消选中,则在输入单个汉字或词组时不会 再出现词语选择框了。,60,2. 词语输入系统默认选中该项,即默认有词语输入功能,此时可输入单 字也可输入词组,如果取消选中,则只能输入单字不能输入词 组,如不能直接输入“计算机”等各种词组。3. 逐渐提示 系统
34、默认选中该项,即默认有逐渐提示功能,此时每输入一 个编码,就在词语选择框中显示与该编码有关的单字或词组, 使用户不用输完所有编码,通过词语选择框就可选择所需的单 字或词组,如果取消选中,则在输入编码时不会出现词语选择 框,只出现编码框。,61,4. 外码提示系统默认选中该项,即默认有外码提示功能,当输入编码 时,在词语选择框中显示相关的单字或词组时,也显示输入这 些单字或词组还需要继续输入的编码,如果取消选中,则当输 入编码时在词语选择框中只显示相关的单字或词组,这些单字 或词组后不显示需要继续输入的编码。5. 光标跟随 系统默认选中该项,即默认有光标跟随功能,此设置下编码 框或词语选择框的显示位置跟随光标移动,显示位置足够时总 是出现在光标的右下方或右方,如果取消选中,则编码框和词 语选择框总是出现在屏幕下方状态栏的固定位置上,不随光标 移动。,62,作业布置,一、理论部分 1、完成课本上第68至69页的习题3 2、完成上机实验指导书上第140至143页的第3章练习题 二、上机操作部分 完成实验指导书上实验9,THANK YOU!,