1、一般汉字的编码规则一般汉字就是除了上述两类汉字之外的所有汉字,这部分汉字也称合体汉字,这是五笔字型需要处理的绝大部分汉字。为了能正常对这些汉字进行编码,五笔字型同时规定了字根码和识别码。1、字根码:五笔字型的每一个字根都位于某一个键上,这个键的编码就是字根码。任何字根,只要位于同一个键上,则它们的字根码都相同。2、识别码:一个汉字的识别码就是这个汉字的最后一笔的代码与该汉字的字型结构代码相组合而成。、汉字的最后一笔代码:汉字的最后一笔可分为五种笔画,其为横、竖、撇、捺、折,分别用代码 1、2、3、4、5 来表示。、汉字的字型结构代码:五笔字型把汉字分为三种字型结构,即左右结构、上下结构和混合结
2、构,分别用代码 1、2 和 3 来表示。如从汉字的组成明显能分成左右两部分,则这类汉字就为左右结构型。如从汉字的组成明显能分成上下两部分,则这类汉字就为上下结构型。除左右结构和上下结构包括汉字的其余汉字均为混合结构型。例如:陈、汉、江、语、码 为左右结构 代码为 1字、笔、定、案、要 为上下结构 代码为 2虎、运、未、图、包 为混合结构 代码为 3、汉字的识别码:汉字识别码汉字最后一笔代码汉字字型结构码。汉字识别码的示例见下表 4-6。表 4-6 汉字识别码示例表例字 最后一笔 代码 字型结构 代码 识别码陈 捺 4 左右 1 41识 捺 4 左右 1 41最 捺 4 上下 2 42数 捺 4
3、 左右 1 41字 横 1 上下 2 12案 捺 4 上下 2 42问 横 1 混合 3 13包 折 5 混合 3 53虎 折 5 混合 3 53未 捺 4 混合 3 43回 横 1 混合 3 133、一般汉字总的取码原则:、按书写顺序从左到右、从上到下、从外到内的原则。例如:“陈“字取码顺序是“阝“(52)、“七“(15)和“小“(43)。“字“字取码顺序是“宀“(45)和“子“(52)。、取大优先的原则。即尽量用笔画较多的五笔字型的基本字根来取码,而不是把其分成更小的单元来取码。例如:“页“字取码顺序是“丆“(13)和“贝“(25),而不是“丆“(13)、“冂“(25)和“人“(34)。、
4、兼顾直观的原则。为了以五笔字型基本字根来取码,有时就不一定按书写顺序来取码。例如:“固“字取码顺序是“囗“和“古“,而不是“冂“、“古“和“一“。为了便于理解和记忆,传统的五笔字型把取码原则编成了一首编码口诀,在这里给出该口诀以方便学习理解和记忆:五笔字型最直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。4、一般汉字的编码规则为:(1)、第一字根第二字根第三字根最后一个字根;(2)、如果不足四个字根,则字根取完后再加该字的识别码;(3)、如果加识别码后还不足四码,则以空格键结束。表 4-7 给出了达到四字根及以上汉字编码示例
5、。表 4-8 给出了三字根汉字编码示例。表 4-9 给出了二字根汉字编码示例。表 4-7 达到四字根及以上汉字编码示例表例字 第一字根编码 第二字根编码 第三字根编码 最后字根编码 键码智 31 13 23 22 TDKJ键 35 53 12 45 QVFP握 32 51 11 12 RNGF编 55 41 51 15 XYNA搬 32 31 33 54 RTEC围 24 12 51 21 LFNH歌 14 23 14 34 SKSW照 22 53 23 44 JVKO表 4-8 三字根汉字编码示例表例字 第一字根编码 第二字根编码 第三字根编码 识别码 键码等 31 12 12 42 TFF
6、U保 34 23 14 41 WKSY定 45 11 21 42 PGHU顺 23 13 25 41 KDMY虎 21 15 25 53 HAMV别 23 24 22 21 KLJH那 53 12 52 21 VFBH炮 44 35 51 51 OQNN表 4-9 二字根汉字编码示例表例字 第一字根编码 第二字根编码 识别码 键码汉 43 54 41 ICY字 45 52 12 PBF伐 34 15 31 WAT位 34 42 11 WUG包 35 51 53 QNV回 24 23 13 LKD冈 25 35 43 MQI汇 43 15 51 IAN注:由于二字根汉字编码不足四码,因此最后必须以空格键结束。