1、 中文输入1. 键盘-输入码输入法记录是键盘输入的字母顺序,是为输入码,这时候的输入码没有转变为机器可读的数字。(不同的输入法的转换方式不同,但结果是一样的)2.输入码-区域码接着,通过汉字编码国家标准 GB2312-80,输入码被转换为了区域码(1980 年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80信息交换用汉字编码字符集基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。)此时的区位码是 2 位的 10 进制数,仍然不能被机器识别。3.区位码-国际码输入法通过信息交换用汉字编码字符集区位码被转变为国际码,国际码
2、是4 位 16 进制数,可以被机器读取,但是不能被机器采用。(国标码是汉字信息交换的标准编码,但因其前后字节的最高位为 0,与 ASCII 码发生冲突,如“保”?字,国标码为 31H 和 23H,而西文字符“1”和“# ”的 ASCII 也为31H 和 23H,现假如内存中有两个字节为 31H 和 23H,这到底是一个汉字?,还是两个西文字符“1 ”;和“# ”于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上 128,即将两个字节的最高位由 0 改 1,其余7 位不变,)4.国际码-机内码机内码是汉字交换码(国标码)两个字节的最高位分别加 1,即汉字交换码(国标码)的两个字节分别加 80H 得到对应的机内码。输入法任务完成。和国际码一样,一个机内码是 4 位 16 进制数,即 2 个字节。