收藏 分享(赏)

国家版式文档格式规范(OFD)中的技术方案.pdf

上传人:精品资料 文档编号:11240726 上传时间:2020-02-22 格式:PDF 页数:5 大小:913.89KB
下载 相关 举报
国家版式文档格式规范(OFD)中的技术方案.pdf_第1页
第1页 / 共5页
国家版式文档格式规范(OFD)中的技术方案.pdf_第2页
第2页 / 共5页
国家版式文档格式规范(OFD)中的技术方案.pdf_第3页
第3页 / 共5页
国家版式文档格式规范(OFD)中的技术方案.pdf_第4页
第4页 / 共5页
国家版式文档格式规范(OFD)中的技术方案.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、蝈辑胡段mail:huxincesiar_cn国家版式文档标准专题l-Topic on National Standards hr Open Fixedlayout Dotalment I编者按:电子会文、数字出版物、电子档案等行业长期存在文档格式不一致、访问接口多样等瓶颈问题尽快解决国内文档存储格式不统一、形成具有自主知识产权的核心技术、切实支持电子文件可管、可控和长期保存成为软件产业当务之急。工信部组织制定具有完全自主知识产权的版式文档格式规范标准,不但有助于电子文件的显示和存档并保证国家电子文件的安全而且进一步整合国家优质的产业资源,推动我国电子文件版式技术等软件产业的良性发展。本期国家

2、版式文档标准专题组织标准起草专家介绍标准重要技术方橐以覆和国际同类标准的比对分析。以飨读者。国家版式文档格式规范(OFD)中的技术方案Introduction ofTechnical Schemes in Open Fixedlayout Document Format中国电子技术标准化研究院王聪李海波丛培勇北京数科网维技术有限责任公司陈亚军摘要概括了为电子文件管理而制定的国家版式文档格式规范的文件格式框架、页面描述、打包压缩等主要内容,分析了其中较为重要的技术方案,包括纯粹版式描述方案、盒式模型、非接脯式模型等。关键词版式文档文件格式框架技术方案Abstract:Conclution of

3、contents and schemas of Fixed-layout Document Format,which is developed for eleclaical filemanagementImponent technical schemes are introduced and analyzed,including format deseription schema,box model,non contact modelKeywords:Fixed-layout Document;document formation Schema;technical scheme1引言版式文档是

4、电子文件应用的一个重要门类是常用的基础办公软件之一其具有原版原式的呈现特点,即阅读显示与印刷效果一致,真实地保持了文档产生之初的文字、图表、色彩等版式信息,具有高保真的显示和打印效果。国家版式文档标准是继办公软件存档格式标准之后在信息技术领域推出的又一项重要标准,是对电子文件进行科学有效管理的基础设施之一。OFD原是开放版式文档(openFixedlayout Document)的英文缩写简称后用作指代国家版式文档格式规范。2 OFD的内容文件格式框架OFD是一种采用 “文件+打包”架构的格式标准,文件除资源性文件如图像和多媒体使用流行的外置格式外,都采用XML文件来描述具体业务。这与OOXM

5、L和ODF以及国内的UOF采用的是同一种框架。页面描述页面描述是版式文档格式中的核心部分,原版原式的呈现特点就靠页面描述文件来保证同时这也是版式文档中其他数据进行工作的基础。页面描述文件主要规定了页面的图层、图元及其具体属性OFD的页面描述采用了自定义的页面描述。打包压缩OFD采用了ZIP格式作为文件架构的打包方案。对XML文件,统一采用Deflate压缩算法:对于资源文件,可根据其格式灵活选择Deflate压缩或者不压缩两种处理方式。安全应用文件的安全应用离不开加密和数字签名。因为暖啜圈万方数据I国家版式文档标准专题Topic On National Standards for Open F

6、ixedlayout Document主体文件是采用XML文件描述的所以OFD选择了XML Signature作为其效字签名方案。其他内容版式文档格式标准还包括导览大纲,自定义标引、信息扩展等内容。这些内容的数据都基于页面描述与文档的页面内容存在着各种层级的引用关系。其共同特点都遵循下文所介绍的。非接触”引用方案。3技术方案31纯粹版式描述方案纯粹版式描述方案又称Delta方案是用于描述页面中的文本图元的,文本图元由一系列字形(字符最后也转化为字形)组成。在标准制定过程中,存在两种文本描述方式,一种是类PDF方式,给出文本的字_“相应的机制忠实记录这些信息即可。这样既避免了引入任何可能引起混乱

7、和实现困难的排版因素,又实现了最为忠于源文档的精确排版效果并且这样做省略了在阅读器端进行排版计算的时间更有利于版式阅读器的技术实现。基于以上认识,本规范中对文本设的定位采用了Delta方案。即精确记录文本图元中每个字形的绘制位置在坐标方向的变动值,即上一个绘制点到当前绘制点在各坐标方向上的偏移值,如图1所示。阅馥方向网冈冈囡囝瓯 BouI基型、字号、词间距、字间距等部分排版要素,阅读器解析文件后必须先对文本对象完成一个局部排版,确定出每个字形的绘制位置后再进行渲染和显示。另一种方式是在版面描述中直接给出每个字形的绘制点或能确定绘制点的直接数据例如绘制点的间距变化,渲染时直接使用这些数据。在专业

8、图文排版系统中,影响字形最终排版位置的因素很多,例如字宽、字型样式(粗体、斜体)、字问距和词间距、不同文种的调整间距、中文排版中的标点压缩、英文排版中的字距调整、字形变换和位置调整、版面中其他图文的推挤等,将这些因素部分引入到版式文档中,则不能解决全部的排版问题,必需辅以大量的拆分和连接:如果全部引入,将使得版式文档处理的业务大大复杂化,需要在内部大量处理本来应当是由专业排版系统处理的问题,版式软件的复杂度也因此增大,版式文档将偏离其原定的设计目标。版式文档是为了原版原式地呈现文件排版后的效果。引入排版因素只是为了确定绘制的精确位置。既然字形的绘制位置在排版软件系统中已经精确确定了就只要在版式

9、文档格式设计二二圈圈圈图1文本的Delta定位在文件生成端。将由排版日I擎确定好的位置简单取差值即可记录到版式文件中,Telta数组的长度等于字形数减去1,在阅读器实现时,从文件中读出这些偏移值简单相加就可以获得每个字形的绘制位置。从而立即开始渲染过程。OFD文本的这一定位方式与微软公司推出的XPS(XML PaperSpecification)是相似的。与PDF中的文本描述方式相比,这种方式具有两个好处:将字形位置的计算交由更专业的上游排版软件来确定。定位效果更为忠实于原文;二是减轻了阅读器端的计算任务,有利于阅读器的轻量化。32页面定位模式一盒式模型版式文档技术领域的领先的Adobe公司,

10、干1995年推出的PDF格式已经成为ISO标准。PDF最初是从打印领域发展起来的,其页面呈现和定位技术模型深受打印和图形接口影响。在这一层次上,通过虚拟打印,任何文件都可以转化为PDF。而实际上,在这一层级上的技术模型与常用的软件所使用的设计模型存在层次上的差异。OFD的页面描述采用了盒式定位模型这一模Il1万方数据型与网页文件、办公文档的排版逻辑层相一致,相比于PDF采用的变换矩阵模型,更加贴近文档数据的源头,更有利于精确记录文档的原始排版信息也有利于引导新的版式文档产生方式即不通过虚拟打印直接生成版式文档的方式见图2。图2 OFD转换方式和图元定位模型的参考层次在盒式模型下。图元的Boun

11、daw是一个非常重要的概念,它规定了图元显示区域的外接矩形,图元在绘制时超出BoundaW的部分将被裁剪掉。使用Boundary存在以下的有利之处:首先,这一概念跟前端软件的排版理念相似有利于很好的承载其排版结果,也利于其自主生成版式文件。第二,Boundaw的使用简化了检查图元的遮盖计算(Overlap),利于在渲染时使用多线程,因为不互相遮盖的图元可以安排在不同的线程中进行。另外,该属性在文本或其他图元选择时,高亮区域拆分连接计算变得简洁。该设置对于鼠标uI位置计算和互操作中也有较好的意义。盒式模型的使用还使未来版式文档在向互动性更强的应用方向例如基于版式的电子表单扩充时,更好地保持技术方

12、案的一贯性,因为大多数表单方案都基于盒式模型的。33数据引用非接触式模型OFD是用XML来描述文件内容的。通常的文档内容中存在多种交叉引用,即文档的内容不能仅用一棵无交叉的多叉树来表示,而需要用多棵在内容上相互交织的逻辑多叉树来共同描述这些树会重复引用文档中的多种内容。例如页面的内容中可能会插八文档形成后加入的各种注释和链接等。更为常见的是文档中被重复利用的字体、图片等多媒国家版式文档标准专题I-Topic On Nadonal Standards for Open Fixed-layout Document I体数据以及图元绘制“样式”等。对于需要重复引用的字体和样式等资源命名唯一标识然后在

13、需要的地方通过这些标识来引用字体和样式是现行常规做法。通过标识进行引用。引用方不会在被引用方中增加任何数据,被引用方甚至不知道它是否被引用了,这种双方不直接接触的引用方式就称为4非接触式4。将这一思路稍加扩展,即可将其应用到需要其他使用引用的场合,例如注释、扩展和自定义标引等。采用非接触式的优点在于切断了直接嵌入方式造成的数据耦合,文件的各个组成模块之间既相互联系叉相互独立,多个业务描述可以在一个文件内同时存在,如图3。例如采用非接触引用方式将注释和页面描述分文件后,对页面添加注释不会破坏对页面进行的数字签名。I孓誓J曲豳f氅謦商旷二。三二1l网圆o n回到嘲蹦ll茴豳 馘娜州 圈嘲lO 固图

14、3非接触引用方案非接触式描述方案的关键在于对象标识的确定。唯一标识的确定有两种:一种是为被引用的节点命名ID,通过ID来引用内容。另一种是通过文件的XPath来引用内容。本格式中选择了m方式,在OFD中,所有对象的标识(1D)是在文档范围内全局唯一的。非接触方案有利于在版式文档中保留更多有用的信息而不影响OFD作为一个通用版式文件的使用。这一特性在某些特定领域例如电子公文、电子票据和权证应用中特别有用,这些应用中要求版式文档(下转第29页)。淼黧:_呻_:囝圉泓至|一一万方数据34中文字体的问题上述的几个字体匹配方案都依赖于字体文件本身的一些属性。但对于中文字体来说存在下列问题:首先对于方块汉

15、字和繁简体字符集字体来说,基本上不会在FixedWidth和Charset这两个属性上比出高低:其次中文字体不存在同一个字体有粗体和斜体等副本,文本斜体效果都是借助矩阵切变实现的,而其粗体效果是借助于勾边渲染实现的Italic、Bold主要是针对拉丁文字字体。因此在OFD的字体匹配参数中只能在FamilyName和Serif这两个度量维度上进行比较而只有像Panow那样对FamilyKind属性的取值进行标准化和规范化。才有可能在数以百计的中文字体中找出你要的替代字体。由于之前没有相应的国家或行业规范各个字体的族名大都跟字体名一样,这样使得中文字体在族名(FamilyName)这一重要维度变得

16、不可度量,任意两个字体在这一混乱的维度上彼此距离都是差不多相等的,而族名这一维度在字体匹配的算法中,其重要程度仅次于编码范围(Charset)。要想在中文字体的匹配上有较好的效果,还有许多研究和规范化工作要做。(上接第2l页)带有结构化的语义信息。34 0FD中的冗余设计OFD在研制时充分考虑了不同厂商问的兼容性问题,比如页面描述中的转换矩阵(CTM)属性,转换矩阵是一个非常强大的特性。可以同时表示缩放、旋转、切变以及上述效果的叠加。但OFD同时在图元中设计了缩放切变和旋转等属性,因此同样一个版式呈现效果。可以用多种OFD的特性组合来描述。例如文本的横向缩放。可以用文本图元的Hscale来表示

17、,也可以用水平缩放的CTM来表示。这种情形就是OFD中的冗余设计,生成版式文档时。实现者可以根据自己所处的实际情景按照自己最熟悉的方案来生成,而阅读器端则应能准确处理这些国家版式文档标准专题ITopic oll Nafional Standards for Open Fixed-layout Documcnt I4字体标准化建议为了让OFD的中文字体的匹配方案能够更好地发挥其功效,应在以下三个方面加强研究:第一,在字体相似度测量的标准上加强研究,找出字体匹配的合适特征,并将其标准化,形成中文字体的匹配度量标准和体系。可考虑以下特征:字体的设计字形外框与其实际字形的外接矩形的比值、字体的Lead

18、ing与字高的比例、字形的笔触特征等。第二。在Panose的架构下寻求字体族名、字体的Family Kind等维度的标准化取值,制定相关的技术标准并强制现有的字体生产商贯彻实施。第三,提供公开源代码的字体匹配和替换算法,促进各类软件在此向技术上的算法的趋同从而在不同的软件之间实现相同的字体匹配效果。事实上字体匹配技术并不单是版式文档领域的事,涉及图文处理的软件都可能需要该技术,及早开展这方面的研究和标准化工作,对于整个电子文件产业都是极有意义的。匠(收橹日期:2012-09-03)方案产生的多种情况。4结语电子文件管理办法提出了对电子文件安全保密可信可控管理的总体目标确保我国电子文件信息长期可

19、控、可读、可用的关键在于电子文件的格式,而版式文档格式标准是其中的重要组成部分。标准文本的确定本身是一个意义重大的事件,但意义更为重大的是标准的技术实现和真正应用。只有通过真正的实践才能验证和发展标准,才能促蓑黧喵存档和交换文件格式向蛀可控的方向沉积。髓(收藏日期:2012-07-10)磁圈圈万方数据国家版式文档格式规范(OFD)中的技术方案作者: 王聪, 李海波, 丛培勇, 陈亚军作者单位: 王聪,李海波,丛培勇(中国电子技术标准化研究院), 陈亚军(北京数科网维技术有限责任公司)刊名: 信息技术与标准化英文刊名: Information Technology & Standardization年,卷(期): 2012(9)引用本文格式:王聪.李海波.丛培勇.陈亚军 国家版式文档格式规范(OFD)中的技术方案期刊论文-信息技术与标准化 2012(9)

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报