1、藏文信息处理技术讲义 藏文字处理软件概述5.3 藏文字处理软件概述进入 90 年代中期以来,随着软硬件技术的飞速发展,基于图形界面的 WINDOWS 操作系统逐步替代了基于字符界面的 DOS 操作系统而成为了微机操作系统的主流。因此,基于图形界面的藏文 WINDOWS 操作系统的研制和开发便成为了这一时期藏字信息处理的核心任务之一。根据实现技术难度和相应功能的不同,藏文 WINDOWS 操作系统的开发有三种可选模式:一是直接在应用层面开发;二是挂接在现有汉英文 Windows 系统下实现;三是系统内核一级实现藏化。由于 WINDOWS 系统结构庞杂,没有公开的系统内核代码可参照,加之产品更新换
2、代速度极快,一般研究单位在系统一级实现藏化基本上是不可能的。因此,实际上可选的开发模式只有前两种。北大方正 1997 年推出了基于 WIN31 的藏文维思彩色印刷系统,但藏文的输入、编辑过程仍需切换到 DOS 环境下进行;西北民族学院信息所于洪志、戴玉刚等人于 2000 年实现了一个基于 WINDOWS 的藏文字处理软件 ,即同元藏文字处理软件,其主要实现技术是通过 WORDAPI 的动态链接库 WLL 嵌入藏文输入法,并在 WINDOWS 下挂接一个TRUETYPE 字库实现。在此前后,青海师范大学也采用类似的技术开发了一个基于Windows 的藏文字处理软件班智达藏文字处理软件,并在汉藏机
3、器翻译系统和藏药信息系统中有所应用。2001 年西藏大学尼玛扎西、洛藏等人和四川火狐信息技术有限公司合作实现了一个基于 Windows 的藏文字处理软件“火狐 ”藏文字处理软件。目前实现的几个藏文字处理软件或在应用层面开发或部分在现有汉英文 Windows 下挂接实现。从这些系统所具备的功能来看,只具备一般的藏字处理功能,因此,我们最多只能称其为基于 Windows 的藏文字处理软件,而不是真正意义上的藏文 Windows 操作系统。具体说来这些软件主要有以下缺憾:(1)所有系统设计时都没有采用国际标准编码。其中有的字库占用 00-FF 区 ASCII码的码位,有的占用 GB-2312 的 1
4、0-15 区或 88-94 区的空余码位,有的字库干脆占用汉字 GB-2312 的 15 区至 81 区的某段码位。(2)由于现有系统都没有采用国际标准编码,就无法支持 INTERNET 藏文信息交换,更不能考虑到与汉英文在系统底层实现兼容处理和对其他应用软件的支持。(3)更有甚者只是针对某个 WINDOWS 应用软件实现藏文字处理功能,如SAMBHOTA 就是典型的仅在 WORD 上实现的一个藏文字处理软件。这类软件一旦脱离WORD 字处理环境后就无法实现藏文字处理。(4)从技术实现角度来看,这些系统主要是在应用层面利用 WINDOWS 的 API 或WORDAPI 函数挂接实现,因此,真正
5、的系统一级的藏文 WINDOWS 操作系统的开发还任重而道远。5.3.1 同元藏文字处理软件介绍同元藏文字处理软件版权属于同元公司所有。同元藏文字处理软件,是基于中文Word 的藏文办公自动化软件,该软件界面友好,系统稳定,安装、操作方便。 提供有藏文白体和黑体两种字库,藏文、梵文两种输入法两种输入法;具有藏文排版功能,支持藏汉英三种文字混合编辑、排版和输出。达到了与中文 Word 的无缝连接,如表格应用、图形藏文信息处理技术讲义 藏文字处理软件概述图像编辑、公式编辑、样式管理、藏文电子邮件发送、对象链接等都可得到支持。同时提供码表转换器用于同元藏文码与方正藏文码的相互转换。利用本软件提供的帮
6、助文件、藏文键盘布局表可使您在短时间内轻松自如地实现在 WINDOWS 系统下藏文信息的处理。此外,在该软件的支持下可实现 Internet 网上的藏文信息传输,还可在高级语言编程中调用藏文输入法和藏文字库,实现藏文软件的二次开发。(1)运行环境本软件分 Windows98 版和 NT 版。“NT 版”则必须运行于 Windows NT。安装过程与 Windows95/98 版相同。 操作系统: 中文 Windows 95/98/NT/2000注:藏文字处理软件不支持 Windows 3.X 。所需软件: 中文 Word97/2000硬件配置: 台式 PC 系列兼容微机或笔记本电脑最低配置:C
7、PU:Pentium133 或更高内存:8MB硬盘:大于 200MB光驱:倍速以上其它设备:鼠标器,软驱 (2)安装前的准备一,确保计算机处于关机状态,且并口没有插入其他设备;二,将本产品中提供的加密狗插入并口;三,若想安装其它并口设备,如打印机等,可将其插入同元藏文处理软件加密狗后端;四,开机启动 Windows 系统,进行软件系统的安装。注意:严禁在计算机带电时插或者拔加密狗!(3)软件安装第一步,将藏文字处理软件光盘放入光驱,系统会自动运行安装程序。如用户计算机没有设置自动安装功能,请双击光盘根目录下的 Setup.exe 文件以启动安装程序。第二步,安装程序启动时,首先检测计算机是否装
8、有中文 Word972000 版本软件,若发现没有,则给出提示对话框, 按确定按钮即可退出安装。用户可在安装中文Word972000 后,重新执行第一步。第三步,若满足安装环境,则显示版权声明,用户按“接受”按钮后进入下一步(否则,将提示终止安装) 。用户输入用户名、公司名并选择安装路径,然后系统检查是否有足够的磁盘空间,若空间不够则提示错误信息并退出安装。若所有条件都具备,用户按“下一步”按钮,本软件所有文件将被复制到相应的目录中。最后按“结束”按钮完成软件的安装。重新启动计算机后在桌面建立“同元藏文字处理软件(标准版) ”快捷方式,程序组菜单中建立“同元”程序组:软件启动文件、用户帮助文件
9、、启动同元藏文网站、系统卸载程序、同元与方正码表转换的快捷方式等。同时在任务栏的输入法选项中添加了藏文输入法和梵文输入法,用户即可使用本软件处理藏文和梵文信息了。安装完成后,请将藏文字处理软件安装盘放在妥善的地方以备以后重新安装使用。(4)藏文字处理软件的卸载用户在卸载前应确保本软件所有应用程序都处于关闭状态。1) 、使用本软件提供的卸载功能点击“程序”菜单的“同元”程序组中的“卸载” ,系统自动将安装在硬盘各个目录中藏文字处理软件的所有文件从 Windows 系统中删除,恢复安装前的状态。2) 、使用 Windows 提供的卸载功能在 Windows 系统的控制面板中,双击 “添加/删除程序
10、” ,单击“安装/卸载”选项卡,藏文信息处理技术讲义 藏文字处理软件概述选中“同元藏文字处理软件” ,然后点击“添加/删除”按钮,即可完成卸载。(5)启动有两种启动方式,一是双击桌面藏文字处理软件快捷方式,二是在“开始”程序组件的“同元”菜单中点击“同元藏文字处理软件”,都会在桌面出现浮动条,其各个按钮功能如下所示: 调 :调用 Word 帮:调用帮助文件 转:调用码表转换器,进行同元藏文编码与方正藏文编码的相互转换 隐:界面最小化 退:退出藏文字处理软件界面 关于:藏文字处理软件版本信息 十:界面移动例如:点击桌面浮动条的“调” ,便进入中文 Word97/2000,用户可进一步选择藏文字体
11、按钮,切换输入法到藏文输入法或梵文输入法即可进行藏文文稿的输入、编辑和打印等。(6)藏文输入法藏梵文输入法布局,考虑到藏文、梵文字母的统一和区别,在一个藏梵文键盘字母布局表中,设计了字型结构不同的藏、梵文两种输入方法,详见藏文键盘表。1) 、键位 藏文数字醓到醞对应 0 9 的数字键;阿拉伯数字放置在 0-9 的上挡键上,三个上加字鈾纋纍安排在 p、键上;下加字鈿鉁纋纎 鉀在 r、R、t、T、y 五个键位上;五个反字軁尓軇軃軉分别安排在繹繻繼繺續的上挡键上;还安排了藏文输入时常用的汉文标点符号“、 ”、 、 、 (、 )等。2) 、输入规则藏文输入法严格按照藏文书写规则依次输入。藏文元音字母、
12、分词符号、分句符号、空格做为一个单元字输入结束的标志。连续输入时会自动判断字符的结束位置,不用按空格键。如:軞 的输入顺序: 鉎 kr 用 、 空格结束 軧 的输入顺序: p; 用 、 空格结束 軟 的输入顺序: 鉎 kri 自动结束 贂 的输入顺序: kyi 自动结束 舺 的输入顺序: sTo 自动结束 3) 、特殊符号的输入 ( : ) : “ : : ” : : : “ : “” 鉌 : 一键输入的字符: 醔 醕 醖 醗 醘 醙 醜 醝 醞 醓 4) 、梵文输入法藏梵文输入法布局,考虑到藏文、梵文字母的统一和区别,在一个藏梵文键盘字母布局表中,设计了字型结构不同的藏、梵文两种输入方法,详
13、见藏文、梵文键盘布局表。5) 、梵文输入法规则梵文输入法取消了上加字和下加字,按照书写规则依次输入字符完成一个字节,用 、或空格键结束。例如:檊 的 输 入 顺 序 : pvYi 獕 的 输 入 顺 序 : BBY 儴 的 输 入 顺 序 : ,yEe 俇 的 输 入 顺 序 : ._yuG 婑 的 输 入 顺 序 : dSruG 岅 的 输 入 顺 序 : DSDSY6) 、古藏文的输入由于古藏文在现代藏文中很不常用,所以将古藏文的输入归类到梵文输入法中。如:偸 的 输 入 顺 序 : .rI 乛 的 输 入 顺 序 : .yI 曨 的 输 入 顺 序 : aI7)、特殊符号的处理在梵文和古
14、藏文中,一些特殊字符用得很少,为了不占用宝贵的键盘键位,给了特殊的键盘编码:噓 : LLL 儵 : ,yee 煥 : SSYuH 涙 : lLH 注:在梵文输入法中,不用上加字 纋 纍 和下加字 纋繾 纎(7)藏文文本的输入、编辑、排版和输出藏文信息处理技术讲义 藏文字处理软件概述按照启动方式进入 Word 后,选择藏文字体和输入法,即可输入藏文。需要注意的是,用户在输入过程中不必介意分词符号出现在行首,完成了藏文文稿的输入,按照要求对字体、字号等设置后,点击軟繳 ,完成藏文文稿的排版。藏文文稿的存储和打印,和使用中文 Word 的方式一样。注意:1.保存在磁盘上的文件名必须是英文或汉字。2.
15、如果藏文文稿很长,排版时间相对较长。(100 页 A4 繴“鉄鉅 纊Z 纇 z 纆X 纉 x 繽C 軃 c 繺V 軁 v 繹B 纅 b 繾N n 纃M m 纁鈼 . 繱? 纄 / 繷5.3.2 班智达藏文输系统简介(1)班智达藏文输系统简介系统简介藏汉西文计算机操作平台 (BADZHIDA VER 1.0)是青海省自然科学基金项目,能挂接在中西文平台下的藏汉西文全兼容的操作平台。该系统具有以下几方面的特点:1) 、具有多种输入法本软件提供了两种输入法:藏文单字输入法(常规的藏文输入法)和词组输入法。目前的其他藏文操作平台还没有词组输入法,因此,词组输入法是本平台的显著特点。2) 、键盘布局合理
16、在键盘的布局上以藏文为主,梵文为辅。藏文字符也是梵文的主体字符,在日常生活中梵文的应用是少量的,因此,藏文键位分配在键盘的最佳位置上,梵文键位放在次要的键位上。3) 、使用范围广本软件可在中英文 Windows9X、 office2000 家族、图象处理、课件制作、视频处理等系统中灵活使用。(2)系统最底运行环境1) 、硬件 IBM 微机及兼容机(486 以上机型) ; 8M 以上的内存 200M 以上的硬盘空间;1、 操作系统环境 WINDOWS95/98/2000/XP(3)系统安装及卸载1) 、系统安装1. 将光盘放入到光盘驱动器中会出现对话框或点击光盘目录下的班智达藏文软件.EXE;藏
17、文信息处理技术讲义 藏文字处理软件概述图 3-1-12) 、在“班智达藏汉西文操作平台安装信息”窗口中按“下一步” ,系统将自动进行安装;3) 、按“完成”即可。4) 、在光盘根目录下点击 Installer.exe 文件,出现安装输入法对话框,点击 “安装”按钮,出现安装成功对话框后,然后点击“离开”按钮即可。2、系统卸载卸载方法如同 WINDOWS 其它应用程序。(4)使用方法1) 、软件的使用启动所要使用的系统后,选择 BZDBT 字体和班智达藏文输入法即可。2) 、藏文键位分配表(5)输入方法1) 、单字输入方法:单字输入方法的输入规则与藏文字的传统读写顺序相同,只要有藏文读写能力或藏
18、文字母识别能力即可掌握该输入法。如: 罢爸邦的输入编码为 kgs; 侧爸邦的输入编码为 lqogs; 拜半的输入编码为 dr;兵邦的输入编码为 rkys。2)、词组输入方法:词组包括双字词组、三字词组、四字词组和四字以上词组,每一个词组的输入编码最藏文信息处理技术讲义 藏文字处理软件概述多为四键。具体输入方法如下: 双字词组的输入方法双字词组输入时依次取该词组中每一字的字根和后置字,若无后置字则只取字根。如:蝶搬表罢邦的输入编码为 sfkk; 表罢扳的输入编码为 kkh; 坝搬的输入编码为 vf。 三字词组的输入方法三字词组的输入时键数必须要达到四键。如果三字词组的第一字有后置字,这时取第一字
19、的字根和后置字,其余的有后置字无关,只输入字根总为四键即可。拜堡稗扳惨罢罢碉扳录入为 vnms 椽罢伴颁办典 录入为 ek;l 诧爸驳伴刀稗录入为 tgg如果三字词组的第一字没有后置字,这时取第二字的字根和后置字,第三字的有无后置字无关只输入字根,总为四键即可。搬豹靛邦佃罢录入为 vxsx 拜遍搬采扳斑录入为 k ,hb 伴表搬罢册邦录入为 kf.s如果三字词组的第一、第二字没有后置字,这时第一、第二字的字根和取第三字的字根和后置字,总为四键即可。霸搬白稗录入为 cf,n 残办罢稗邦录入为 mlns 泊扳拜便拜录入为 ghkd若全无后置字则第三字的字根为两键。保办绊录入为 vlxx 仓 捶糙录
20、入为 qfqq 雹瘁拜录入为 vhdd 四字词组的输入方法搬豹靛邦搬炒点罢邦录入为 vxdl 雏档罢邦地爸碘罢邦录入为 b;rl扳捕稗斑敌橙耻拜录入为 gbdn 四字以上词组的输入方法诧爸驳伴刀稗卞惨伴幢办录入为 tge 扳便典罢捶拜地罢邦半爸碧爸庇办录入为 klfc炒搬得稗罢电罢邦斑敌惨邦迸录入为 dpxv5.3.3 桑布扎藏文软件目前在全世界范围内有许多不同的藏文软件,由于藏文的 ASIIA 码没有确定下来,所有的藏文软件几乎互相不兼容,相当于各自属于各自的范围内,无法与外面沟通,使得藏文信息业的发展缓慢。 藏文信息处理技术讲义 藏文字处理软件概述首先我们介绍一下桑布扎藏文软件的安装及其应
21、用。 该软件属于国外编写的软件之一,编写软件的语种是英语,目前有几个不同的版本。但没有太大的区别,只是在安装过程中有些不一样,在桑布扎新版本中多了一种语音打字方法。 桑布扎藏文软件出现的比其他藏文软件相对早些,但是该藏文软件没有利用一般的输入法生成器等来制作,它是在 Microsoft Word 的支持下,新建一个控件来实现。而且由于考虑到藏文与梵文的双方面问题,在字库中将近有 40 多个字体,系统调用的时候速度较慢,有时影响其他语种在电脑中录入和修改等操作。当然该软件目前为止最大的特点是,字体漂亮,能够更快的畅通无阻的打梵文,这方面几乎得到所有藏族的认可。 注:桑布扎藏文软件只能在 Micr
22、osoft Word 中应用 优点: 1. 字体美观,可以输入梵文 2. 输入有一定的语音规律 缺点:1. 网络应用差 2. 系统要求高 3.使用仅限于 Microsoft word5.3.4 央金藏文输入法 1.0为了克服现有各种藏文计算机键盘布局与输入法所存在的缺陷,“央金藏文输入法”依据计算机键盘布局的基本理论、若干原则、相关科学研究成果和基于藏文语料库的字符、部件、音节、词汇统计数据,遵循藏语语法规则及其特殊性和藏文基字与上下、前后、又后加字及元音配置的规律,在对计算机键盘键位的属性进行专门研究的基础上,研制出“一键多符”,即在同一个键位上整合多个藏文部件和“一键到位” ,即在输入现代
23、藏文时无需切换上档,并配合输入提示行、软键盘,以及将使用频度最高的藏文“隔字符”布局在空格键(SP )上的智能化键盘布局及输入法。其藏文文本的键盘输入速度和效率成倍提高 ,对藏文印刷、办公自动化和信息处理具有广泛的使用价值。(1)特点介绍:1) 、本输入法使用藏文国际标准编码字符集(ISO/IEC106461)和与之相一致的Unicode 国际标准 ,使输入的文本完全是国际通用的内码,可在任意一台装有XP、 VISTA 的计算机上打开和使用,显著区别于现有藏文输入法输入文本的编码均使用“假码”和互不兼容的状况 ;2) 、本输入法采用国际领先的 OpenType 字处理技术,结合布局在 “H”键
24、位上的“LINK”功能键(控制用连接符键) ,可拼写输入任意的藏文、梵文。可多层叠加字符,藏文最多 4 层,梵文可达 8 层,解决了现有藏文输入法“缺字”的问题;藏文信息处理技术讲义 藏文字处理软件概述3) 、采用“一键多符” 、 “一键到位 ”等技术和基于藏文语料库的字符、部件、音节、词汇等统计数据并结合藏文特有的拼写规律,科学合理地设计了藏文键盘布局, 一般 2-3 键即可完成一个音节的输入,可实现输入的“盲打”,极大地提高了藏文输入的速度;4) 、解决了 Windows XP 下不能输入藏文国际编码的问题,实现了在 Windows XP 下也和 Windows Vista 一样,可以方便
25、地使用和处理藏文;5) 、设计了藏文基本输入键盘、梵文输入键盘、标点文化符键盘等多种输入键盘和相应的藏文基本输入、藏文字符输入、梵文输入等多种输入模式,方便用户不同的输入要求和目的;6) 、提供梵文与标点文化符软键盘,可直观、方便地鼠标或键盘输入任意梵文字符。另外,还有拼音、日文、俄文、希腊文、标点、数字、数学、单位、特殊符号等 11 种软键盘;7) 、本输入法生成的文本,可使用藏文转换软件(UTFC)与方正、华光、班智达、桑布扎等十几种藏文字处理软件进行编码转换,以满足藏文文字处理不同层次、任务的多样化需求。 8) 、本输入法支持在 XP 下,在互联网上搜索、浏览全球的藏文国际编码信息和制作
26、藏文网页(2)适用的平台: Windows XP 、 Windows Vista 5.3.5 藏大岗杰藏文输入系统藏大岗杰藏文输入法是针对我国藏文信息处理应用的需求,采用规范化、标准化的基于 Windows NT 以上版本的系统上开发而成,是一个完全面向用户的,基于藏文字、词,梵音转写藏文(梵文)进行输入,力求快速流畅地输入藏(梵)文字。其特点是:1)符合国家藏文编码字符集标准体系2)支持大容量词库3)兼容 Microsoft NT/2000/XP 中文版,兼容 Microsoft Office、Internet Explorer 中文版等系统和应用软件。4)支持用户自造词 (1)产品组成藏大
27、岗杰藏文输入系统是基于信息技术 信息交换用藏文编码字符集 基本集(GB16959-1997) 、 信息技术 藏文编码字符集 扩充集 A (GB/T 20542-2006) 、 信息技术 藏文编码字符集 扩充集 B (报批) 、 信息技术 藏文编码字符集键盘字母数字区的布局 (报批)国家标准的藏文输入系统,包括四个部分: 藏文(现代藏文)以及部分常用梵音转写藏文(梵文)输入系统; 梵音转写藏文(古藏文)输入系统; 藏文词组输入系统;藏文用各种符号的输入系统。藏文信息处理技术讲义 藏文字处理软件概述藏大岗杰藏文输入系统是基于信息技术 信息交换用藏文编码字符集 基本集(GB16959-1997) 、
28、 信息技术 藏文编码字符集 扩充集 A (GB/T 20542-2006) 、 信息技术 藏文编码字符集 扩充集 B (报批) 、 信息技术 藏文编码字符集键盘字母数字区的布局 (报批)国家标准的藏文输入系统,适用于有藏文应用需要的各种行业,如各级政府行政办公、金融、教育、科研、公检法、媒体等。用户可以通过本软件在藏文信息处理、藏文信息资源管理时输入所有现代藏文、各种符号及 98%的梵音转写藏文的需要。安装与卸载先,请您确认您使用的计算机操作系统是否为为微软的 Windows NT 以上,如果低于此版本,如 Windows98,则本软件无法正常使用。请先升级您的系统到 Windows NT 以
29、上,再安装本输入系统。其次确认您的计算机是否配备光盘驱动器(CD-ROM) ,因为本系统需要借助光盘驱动器安装。输入法安装过程中,安装向导将指示您阅读有关信息,并完成安装。安装过程中用户无需输入用户信息,也不需要指定安装在哪个文件夹中。成功安装后,将在系统的“开始| 程序”菜单中,创建子菜单“藏大岗杰藏文输入法 V3.2”。安装后,软件占据您的 Windows 系统所在硬盘分区约 1M 字节的空间。安装完毕后,您可以使用控制面板中的输入法设置,修改输入法的切换热键等设置。如果你想从系统中删除藏大岗杰藏文输入法,建议您如下操作: 在控制面板的“输入法” 中删除藏大岗杰藏文输入法; 在控制面板的“
30、添加或删除程序”中删除藏大岗杰藏文输入法的程序文件;在“开始|程序”菜单中,选择“卸载藏大岗杰藏文输入法 V3.2”。(2)输入法的基本知识藏大岗杰藏文输入系统是基于信息技术 信息交换用藏文编码字符集 基本集(GB16959-1997) 、 信息技术 藏文编码字符集 扩充集 A (GB/T 20542-2006) 、 信息技术 藏文编码字符集 扩充集 B (报批) 、 信息技术 藏文编码字符集键盘字母数字区的布局 (报批)国家标准的藏文输入系统,配备了多种符合藏文用户习惯的藏文输入法,以实现在不同的藏文文本编辑器中输入藏文。在系统中安装了岗杰藏文输入法之后,用户还可以使用汉字输入法和其它藏文输入法,汉字输入法包括微软拼音输入法、智能 ABC、五笔等,藏文输入法包括以下四个部分: 藏文(现代藏文)以及部分常用梵音转写藏文(梵文)输入系统; 梵音转写藏文(古藏文)输入系统; 藏文词组输入系统;藏文用各种符号的输入系统。(3)输入法的使用1)启动文字编辑器藏大岗杰藏文输入法提供了用户输入藏文的能力,而作为前提,必须在应用程序的输入区域中输入字符。常见的输入区域包括各种文字信息处理和文本编辑器,如下图所示的微软 Office2003 编辑窗口。