[发明专利]一种内嵌字体数据处理方法及装置有效
| 申请号: | 200910084623.0 | 申请日: | 2009-05-18 |
| 公开(公告)号: | CN101894098A | 公开(公告)日: | 2010-11-24 |
| 发明(设计)人: | 仇睿恒;王毅;丁力 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正技术研究院有限公司 |
| 主分类号: | G06F17/22 | 分类号: | G06F17/22 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 字体 数据处理 方法 装置 | ||
技术领域
本发明属于文字处理技术领域,特别涉及一种内嵌字体数据处理方法及装置。
背景技术
现今在很多情况下,文档处理会面临大量的内嵌字体处理。所谓内嵌字体指的是嵌入到文档中的字体文件,以保证文档在任意平台上打开时都能找到相应的字体。一般来说,一个包含内嵌字体的文档往往包含大量的小体积内嵌字体文件。这些小体积内嵌字体文件经常会零散的分布在文档各处。各个小体积的内嵌字体文件都对应一个内嵌字体文件名,当读取各个小体积的内嵌字体文件(例如提取文档中所有内嵌字体,或者是利用某一内嵌字体来展示文字)时,首先根据待读取的内嵌字体文件名,在文档中进行搜索,然后找到与该内嵌字体文件名匹配的内嵌字体数据。因为一个包含内嵌字体的文档包含有大量的小体积内嵌字体文件,所以若大量的内嵌字体都采用上述的方法进行访问操作,则访问效率较低。此外,现今大量的文档格式采用了XML与Zip打包相结合技术方案。在Zip包中存在大量小体积文件时,也会降低文档的打开、更新、查找等访问效率。
发明内容
为了解决对一个包含内嵌字体的文档进行访问操作时,访问效率较低的问题,本发明实施例提供了一种内嵌字体数据处理方法,包括:
获取各内嵌字体数据;
为各内嵌字体数据分配对应编号,并建立编号和内嵌字体数据存储位置信息相对应的第一绑定关系,所述内嵌字体数据存储信息包括:内嵌字体数据偏移量和内嵌字体数据大小;
根据各内嵌字体数据偏移量和内嵌字体数据大小得到各内嵌字体数据,将各内嵌字体数据以及第一绑定关系集中存储。
同时本发明实施例还提供一种内嵌字体数据处理装置,包括:
获取模块:用于获取各内嵌字体数据;
第一建立模块:用于为各内嵌字体数据分配对应编号,并建立编号和内嵌字体数据存储位置信息相对应的第一绑定关系,所述内嵌字体数据存储信息包括:内嵌字体数据偏移量和内嵌字体数据大小;
存储模块:根据各内嵌字体数据偏移量和内嵌字体数据大小得到各内嵌字体数据,将各内嵌字体数据以及第一绑定关系集中存储。
由本发明提供的具体实施方案可以看出,正是由于利用索引结构可以根据内嵌字体数据编号直接得到内嵌字体数据存储信息,进而提高访问效率。
附图说明
图1为本发明提供的第一实施例内嵌字体文件包的文件格式图;
图2为本发明提供的第一实施例方法流程图;
图3为本发明提供的第二实施例装置结构图。
具体实施方式
本发明提供的第一实施例是一种内嵌字体数据处理方法,该方法是将内嵌字体数据抽取出来集中存放到字体数据块中,从而利用索引结构提高访问效率。进而还将内嵌字体的字体编码与字形索引号(Glyph Index)的映射信息也保存起来。在使用时,通过待处理的内嵌字体的编号,就可以得到所需的内嵌字体数据,和相应的字体编码与Glyph的映射信息。
其中,内嵌字体数据在存储时可以按照一定的压缩方法统一进行压缩;索引的组织方式还可以提供了多种优化的方法,进一步提高访问效率,从一个包含100个内嵌字体的文档中收集各内嵌字体并保存在一个内嵌字体文件包中,该内嵌字体文件包的文件格式如图1所示,对其中的各内嵌字体执行如下方法,方法流程如图2所示,包括:
步骤101:获取对应字体文件名为“aaa...111”的内嵌字体数据a1,并获取该内嵌字体数据在应用层保存的对应的映射信息(如CMap);
步骤102:将映射信息转化为相应CharMap表a1。CharMap表a1包括若干个字体编码和各自对应的Glyph信息。
步骤103:按照指定或默认的处理方法对内嵌字体数据a1和CharMap表a1进行处理。例如按照指定或默认的压缩方法对内嵌字体数据a1和CharMap表a1进行压缩。压缩方法可能是Flate、LZMA等。或者按照指定或默认的加密方法对内嵌字体数据a1和CharMap表a1进行加密。当然也可以对即进行压缩处理又进行加密处理。
步骤104:将处理后的内嵌字体数据a1和CharMap表a1保存到内嵌字体文件包的一个字体数据块中。
步骤105:为内嵌字体数据a1和CharMap表a1分配一个索引号2,在内嵌字体文件包索引号为2的索引中增加CharMap表a1数据偏移量、内嵌字体数据偏移量、内嵌字体数据大小等。本实施例中,各内嵌字体数据拥有唯一的编号,采用编号如编号2代替原有的字体文件名“aaa...111”。
步骤106:在内嵌字体文件包的文件头部信息中标明自我标识、版本和索引位置等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正技术研究院有限公司,未经北京大学;北大方正集团有限公司;北京北大方正技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910084623.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网上搜索书源的方法及其系统
- 下一篇:一种数据存储方法及系统





