1、浅谈 Ceb 技术及其在图书馆中的应用陆杰(湛江师范学院图书馆 湛江 524048)文 摘 CEB 中文电子文档格式能有效解决当前 电子文档不 统一的问题,本文阐述了 CEB格式及其特点,在图书馆应用中的 优势,以及 图书馆用其开展各 项服务的意义。关键词 CEB 图书馆 电子文档CEB and Its Application in LibraryLu Jie(Library of Zhanjiang Normal College, Zhanjiang 524048,China)Abstract: CEB format can resolve the skimble-scamble probl
2、em of current electronic document effectively, this paper elaborate CEBs format and its features, analyses advantages of its application in library, and discusses significances of CEBs application in library services.Keywords:CEB library Electron documentCEB 即 Chinese eBook,是北大方正开发的完全高保真的中文电子文档格式,能有
3、效解决当前电子文档不统一的问题。从 2002 年推出至今,CEB 格式已经得到了国家电子政务标准化总体组的肯定,国家有关部门部门已把 CEB 格式作为电子公文传递的标准格式。据了解,目前江苏、哈尔滨、安徽、广州等地政府都已经统一采用 CEB 作为版式文件格式。同时 CEB 文件格式已经广泛的应用于网络出版中,全国主要的出版社都采用 CEB 作为电子书文件格式标准。1 CEB 格式的特点1.1 CEB 可以较好地保持文件原版样式CEB 能够保留原文件的字符、字体、版式和色彩,包括图片、数学公式、化学公式、表格与文件中的圈注、批注、划线等一切信息。同时 CEB 格式文件一旦生成便不能随意篡改,保证
4、了公文正确、完整和保密,符合国家行政机关对公文格式的严格要求,也符合数字化档案的保存与利用。1.2 CEB 系统支持多种语言种类支持汉语、少数民族语言、英语等多种语系,可以完成自动分类、自动摘要、图片检索等操作,很方便用户的使用,更为重要的是可以极大地减轻档案管理人员的工作负担。1.3 CEB 具有数字签名、数据加密功能可以使档案管理人员在保护档案知识产权的基础上,有权限地为用户提供利用。具体来说有以下特点:(1)文档的加密采用随机密钥,每一个文档的加密密钥都不同;(2)采用高强度加密算法,有效保证系统安全性,用 1000 台P417G 计算机并行强制解密需要 1 万亿亿年。所以未经授权,即使
5、得到受保护的电子文档,也不能阅读;(3)采用机器绑定技术,保证文档只能在指定机器访问,防止二次传播;(4)采用消息摘要技术,防止对电子文档内容和使用权限的篡改;(5)灵活的安全机制,针对每一个文档可设置不同的安全策略,文档的权限管理由业务人员设置,做到了业务人员与 IT 人员的职权分离;(6)控制电子文档的使用,限制阅读、阅读时间、打印、打印份数;(7)使用过程可跟踪,*本文系湛江师范学院人文社会科学研究项目“智能检索技术在数字图书馆的主要应用与研究”(项目编号:W0628)研究成果之一。记录电子文档的使用情况,监控文档被何人、在何时、做何种操作;(8)可无缝的嵌入到用户内网(Intranet
6、)中,支持 IE 直接浏览。1.4 CEB 格式可以加入多种压缩方法可以对文字及图像信息进行很好压缩,使文档保持最小,因此数据量小,在排版比较复杂的情况下,只有原来 DOC 文件的十分之一,传输及存贮较为方便等,支持多种颜色空间和色彩控制,支持复杂的表单设计,有较好的屏幕与打印输出效果。1.5 CEB 文件制作及使用方便用户可以在 CEB 上制作目录、链接跳转,增加声音、动画和视频,可以在CEB 上画线、批注等其他应用。CEB 格式转换方便,通过 Apabi Maker 等电子文档的转换软件,能够将 TXT、RTF、PS、S2、S72、PS2、EPS、TIFF、DOC 等格式的文件转换为用于阅
7、读的电子文件格 CEB。2 CEB 格式与流行的两种电子格式 PDF 和 CAJ 的比较2.1 PDF 格式PDF 是 Portable DocumentFormat 的缩写,意思是“可移植文档” ,由Adobe 公司开发。它是一种通用文件格式,能够保存任何源文档的所有字体、格式、颜色和图形,而不管创建该文档所使用的应用程序和平台。也就是说,无论字体、软件和操作系统,PDF 始终如原文件一样显示。目前 PDF 已经成为全世界电子文档分发的公开的实际标准。PDF 可以很好的保持档案的原貌。PDF将忠实地再现原稿的每一个字符,颜色以及图像。不管显示器是何种类型, PDF 文件放大到 800%而丝毫
8、不损失,清晰精确的颜色匹配可以忠实再现原文。同时独立于软件、硬件和创建的操作系统。PDF 文件是以 Post Script 语言图像模型为基础,无论在哪种打印机上都可保证精确的,颜色准确的打印效果。PDF 文件比源文件小很多,在 Web 上下载文件的同时可以快速地显示页面,而不会降低网络速度。利用者不需要下载整个 PDF 文件然后再阅读,只要得到第一部分数据,可以按需继续下载其它的页面。也就是说利用者看完第一页可以立即跳到第八页,不用浪费时间去等下载。从这个意义上说, PDF 非常适合网上传输。PDF 需要专门的阅读器 Acrobat Reader 来读取,Acrobat Reader 可以嵌
9、入浏览中,当你在浏览网页时如果看到了 PDF 文件,只要用鼠标点它一下, Acrobat Reader 就会自动打开这个 PDF 供你阅读了。对于档案管理者来说, PDF 文件有绝佳的安全性,它能够控制机密文件的访问权限。可以防止他人复制、改变,打印 PDF 上的文本和图像。2.2 CAJ 格式清华大学中国学术期刊(光盘版)电子杂志社在“中国期刊网”的网络出版中,开发了 CAJ 文件格式。它支持中国期刊网的 CAJ、NH、KDH 和 PDF 格式文件。CAJ 封装文字和插图信息在单一的文件中,完整保留原来文件的版式信息,打印效果与原版的效果一致。有打印全文功能和机上摘录功能,可以放大和缩小页面
10、,并有在当前页面内的查找字符功能。因此虽然它是为了学术期刊上网而开发的,根据它的以上特点,也可以考虑在档案数字化中使用这种格式。2.3 三种格式的比较从打印效果来看,PDF、CAJ 与 CEB 格式都保持原刊版式,基本没有差异;从屏幕显示来看,AcrobatReader 对 PDF 文件的显示效果优于 CAJViewer 对 CAJ文件的显示效果;从传输速度来看,以航空学报2000 年第 1 期第 1 篇文章为例, “万方数字化期刊”上的 PDF 文件为 215k,而“中国期刊网”上的 CAJ文件是 153k,CEB 则是 150k,可见 CAJ 与 CEB 压缩比更高,更有利于网上传送;从流
11、行程度来看, PDF 格式已经是事实上的工业标准,广泛用于各行业的文档传递,因而较 CAJ 与 CEB 格式更成熟;PDF 是外国公司 Adobe 的产品,而 CAJ与 CEB 是我国拥有完全自主知识产权的产品,从安全性与费用等多方面考虑, CAJ 与 CEB 格式更适合我国档案工作的实际情况。从以上分析可以看出, CEB是最适合我国公文处理与档案管理的电子格式。从电子政务考虑, CAJ 与 CEB格式更适合我国档案工作的实际情况。从我国实际使用情况看,CEB 更多地用在了公文处理与保存方面, CAJ 则关注学术期刊领域。在实际工作中,为减轻档案部门的负担,文书部门应将各种格式的电子文件转换为
12、 CEB 格式后再进入档案部门的数据库进行归档录入、提供利用等。已进馆的电子文件可以通过 CEB 转换软件直接转换为 CEB 格式,传统档案则可以在扫描后再转换为 CEB 格式,或以图片保存。3 CEB 技术在图书馆中的应用3.1 CEB 文档的创建CEB 文档的创建可以使用 Apabi 转换软件(Apabi Maker)。Apabi Maker 是一个数据转换工具,可以把用于印刷的电子文件,包括S2、S72、PS2、PS、EPS、TIFF、DOC、PDF 等文件,转换为可用于阅读的电子文件 CEB。系统集成商可以通过 Maker ocx 提供标准的接口,方便的集成 Apabi Maker,在
13、应用系统中实现“一键式“生成和阅读 CEB 文件。转换成的 CEB 文件完全保持原来的版式,包括原始文件中的图片、表格、色彩等复杂的版面内容,都正确地保留,阅读效果与原版式一样。使用它的标准公文生成系统,直接填写表单,生成 13 种符合标准规范的 CEB 公文,又或者从公文数据库中提取公文要素,批量、自动生成符合标准规范的公文 CEB,解决 OA 系统中公文格式生成。纸质公文则通过高速扫描仪生成 TIFF 文件,OCR 识别生成后,生成双层的 CEB文件,阅读原版文件,并可以实现文件内容的检索和摘录,并能准确定位信息。另外也可以使用方正书版、飞腾排版软件,排版定稿的正式文件,通过内置的CEB
14、转换插件,直接保存为 CEB 文件。这样图书馆的工作人员就可以把自己的文件、宣传册子、书籍、图片等转化成电子格式,再放上网络提供给读者。3.2 创建的 CEB 文档具有安全性和实用性(1)CEB 保证了文件发布准确性CEB 是一种复合文件格式,由文件的属性信息和版式信息两部分组成。CEB 包含版式信息和 XM L 逻辑信息,是数据文件的保存格式。属性信息以 XML 方式定义,可以通过接口进行读取和设置;版式信息描述了页面中呈现的各种内容,它规定了文字、图形、图像以及流媒体信息元素的描述方式、属性及相互的联结关系,定义了一个设备无关的页面模型,并定义了一批操作指令把这些元素定位到页面模型上。目前
15、,政府日常办公中常用的字处理排版软件如 WORD、WPS 等,生成的所有结果文件都可以方便地转换成 CEB 格式,而且能保真、保全文件内容,但 CEB 格式不能逆转,也就是说,WPS 格式转换成 CEB 格式后无法再复原成 WPS 格式,保证了其安全性。在日常工作中多种文件格式的存在,给文件的保存、查阅、交换带来了很多困难,运用 CEB 格式将各种公文格式统一,在生成到归档整个公文生命周期中,实现了电子文件的统一传输、保存、管理与利用,从而有助于“文档一体化”的实现,提高图书馆工作效率,保证了文件发布准确性。(2)可以对生成的 CEB 文件添加其它信息利用 Apabi Writer 可以丰富
16、CEB 文件,添加以下类型的信息:公文签收信息,如加盖签收章(文件编号、接收时间) ,填写文件主送、分送、抄送信息等(国办值班系统应用) ;标识公文密级信息(国家保密局立项项目) ;添加公文要素信息,标定公文属性(广州公文交换项目应用) ;添加公文目录、超级链接等,用于文件汇编工作(江苏省政府项目应用) ;添加音频、视频多媒体链接等,尤其制作领导讲话文件时,可实现文、图、影、音合一的多媒体文件。通过领导手写批示系统,可以在 CEB 文件上进行批阅。3.3 CEB 文档易于使用方正 Apabi Reader 用于电子文件阅读,可以阅读 CEB、PDF、HTML、TXT和 OEB 等格式的文件,可
17、嵌入到 IE 中使用,使用界面友好。其功能包括:(1)版面操作功能包括:字体放大、缩小,界面旋转,添加删除书签等;(2)页面笔记功能:划线、加亮、圈注、书签、批注等。(3)个人电子文档管理:文档分类、排序等。(4)方便的全文查找、部分拷贝功能等。直接打印出纸质文件。(5)通过标引工具,生成 XML 公文要素,实现文件信息交换。(6)通过 CEB SDK 导出 TXT 文本文件,实现文件的检索、再利用。用户可以从 Apabi 官方网站各大网站下载 Apabi Reader,当版本升级时,系统还会提醒用户。另外,Apabi Reader 也为用户提供了完备的帮助功能,方便用户对各种工具的查找使用。
18、3.4 CEB 文档的的权限控制可以满足图书馆的需要CEB 文档采用 DRM 技术,文档经过加密后传输,阅读时根据访问权限,由系统自动控制阅读者的权限,对文档提供最好的保护措施,有效地控制文档的访问权限,文档不同级别多种类型的安全控制使得图书馆能够根据所提供信息的不同以及用户对象的不同采用不同的安全机制,对于馆藏数字化文献,自建数据库等,图书馆可以采用较高的安全控制即必须使用用户密码才能打开或只准打开而禁止其它操作,限制只有收文的 PC 机可以阅读所收文件,不可复制及转发,限制阅读时间等;对于展览讲座,图书馆可以采用一般的安全控制,允许打开、复制、打印,在校园网范围内使用等;对于用户教育所提供
19、的资源以及一些互动性较高的服务可以采用较低安全控制,允许用户添加注释等等。电子文档的应用环境比较复杂,通过电子文档的加密和 DRM 控制,可以对电子文档的操作和使用建立适当的日志记录机制,追踪文档的使用和传播状况。不同的应用领域中,记录和关注的日志类型略有不同。电子文档应用中,记录的日志通常包括:阅读(人员、文件、时间、地点) 、打印(人员、文件、时间、地点、打印份数) 、证书下载、授权变更等。电子文档的日志记录,一方面便于追踪意外情况下的信息泄密源头,锁定泄密范围,另一方面可以对文档应用情况进行审计,积累文档工作经验,提高电子文档的办公效率。 4 图书馆利用 CEB 技术开展各项服务的意义4
20、.1 丰富图书馆对读者的服务在大力提倡建设和谐社会的今天,图书馆也越来越重视对读者群体的服务。图书馆工作者把更多的文本信息转化成电子文档,或者制作自身特色的电子杂志,可以让读者更方便、及时、准确地得到和查阅文档。满足读者的需要,提高读者读书的兴趣和对图书馆的关注程度。因此,电子文档在图书馆的应用必将促进和方便这部分用户通过网络获取图书馆服务,提高图书馆对读者的服务水平。4.2 提高图书馆网上展览和讲座服务的水平展览、讲座服务是图书馆的扩展服务,目前越来越多的图书馆开始重视这两种服务的提供,并且在网上提供展览、讲座的信息,方便用户随时查看。使用 CEB 文档格式制作网络版的展览、讲座,可以将图像
21、、声音、动态影像等嵌入文档,并且保持原始效果,即使用户没有亲自参加展览、讲座的开展,也能从网上获得最佳的服务效果。4.3 方便图书馆用户教育的开展用户教育是图书馆为了使用户更多地了解和利用图书馆资源而开展的一项服务,通过用户教育,用户可以获得有关图书馆的资源分布、规章制度、数据库的使用等信息。用户教育的方式很多,例如新生入学教育。定期或不定期的讲座、发放宣传单等,无论采用哪种形式,都不能忽视网络这一工具,使得用户在需要时、就能从网上获得教育信息。图书馆利用网络开展基于文档格式的用户教育时,可以采用较低的安全控制,允许用户根据自己的学习需要添加注释,使用户教育发挥最大作用。参考文献1 杜树军.
22、用 PDF 制作可以用于光盘发布的电子出版物. 现代图书情报技术,2002(4) :89-902 王贺芹. 电子文件及电子档案管理初探. 现代图书情报技术, 2002(S1) :64-753 方宝花. 期刊网络出版中的文件格式比较. 情报杂志, 2005(2) :24-254 马良. 论文档一体化管理. 情报杂志, 2002(12) :46-505 周媛. 数字图书馆资源格式浅析. 河南图书馆学刊, 2002(1) :24-266 苗喜德. 关于电子读物文件格式简介. 河北科技图苑, 2003(3) :79-807 周永辉,黄世喆. 网络环境下文档一体化的技术性制约因素分析. 广西民族学院学报
23、(自然科学版) ,2006(3) :1211238 吴晓,孙希文. 具有自主知识产权的 CEB 电子文件归档格式浅析. 档案与建设,2006(5) :17-189 Apabi 官方主页 http:/ (Accessed Jan. 5, 2007)10 Apabi reader3.0 软件的帮助工具陆杰 湛江师范学院图书馆。联系方式电话:0759-2580302,0759-3183804(办公)email:地址:广东湛江市赤坎区寸金路 29 号湛江师范学院图书馆邮编:524048*本文系湛江师范学院人文社会科学研究项目“智能检索技术在数字图书馆的主要应用与研究”(项目编号:W0628)研究成果之一。