[发明专利]一种应用于文件格式转换场景下的目录生成方法和装置有效
申请号: | 201510390513.2 | 申请日: | 2015-07-06 |
公开(公告)号: | CN106326194B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 代芳;杨勇 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 标题样式 目录索引 文件格式转换 匹配规则 方法和装置 目录生成 可识别 读取 场景 工作效率 预设内容 排版 匹配 应用 样式 重复 | ||
本发明涉及数字排版领域领域,公开了一种应用于文件格式转换场景下的目录生成方法和装置,包括:读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;根据所述第二文档可识别的标题样式,生成目录索引文件;根据所述目录索引文件,从设置后的第一文档中提取出符合所述目录索引文件中标题样式对应的内容;将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。本发明用以解决在文件格式转换下操作繁琐重复的问题,加快生成目录的速度,提高工作效率。
技术领域
本发明涉及数字排版领域,尤其涉及一种应用于文件格式转换场景下的目录生成方法和装置。
背景技术
EPub(电子出版,Electronic Publication)是一种开放式电子书格式,可以在EInk(Electronic Ink电子墨水)电纸书、手机、笔记本电脑等便携式的设备上阅读,其文字内容可以根据阅读设备的特性(如屏幕尺寸、不同平台),以最适于阅读的方式显示。
目前,经常需要将Microsoft Office Word文档转成EPub电子书格式以方便使用。在转换过程中,需生成EPub格式的目录,现有的一般做法是将Word文档中的标题一条一条添加到EPub格式的目录中。这种方法操作重复繁琐,生成目录的速度慢、效率低。
发明内容
本发明实施例提供一种应用于文件格式转换场景下的目录生成方法和装置,用以解决在文件格式转换下操作繁琐重复的问题,加快生成目录的速度,提高工作效率。
本发明实施例提供的应用于文件格式转换场景下的目录生成方法包括:
读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
根据所述第二文档可识别的标题样式,生成目录索引文件;
根据所述目录索引文件,从设置后的第一文档中提取出符合所述目录索引文件中标题样式对应的内容;
将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
所述读取第一文档之前,还包括通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
所述根据所述第二文档可识别的标题样式,生成目录索引文件,具体包括:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为MicrosoftOffice Word,所述第二文档的文件格式为电子出版EPub。
一种应用于文件格式转换场景下的目录生成装置,包括:样式匹配模块、目录索引模块、标题提取模块和目录生成模块;
所述样式匹配模块,用于读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510390513.2/2.html,转载请声明来源钻瓜专利网。