[发明专利]一种应用于文件格式转换场景下的目录生成方法和装置有效
申请号: | 201510390513.2 | 申请日: | 2015-07-06 |
公开(公告)号: | CN106326194B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 代芳;杨勇 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 标题样式 目录索引 文件格式转换 匹配规则 方法和装置 目录生成 可识别 读取 场景 工作效率 预设内容 排版 匹配 应用 样式 重复 | ||
1.一种应用于文件格式转换场景下的目录生成方法,其特征在于,包括:
读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
根据所述第二文档可识别的标题样式,生成目录索引文件;
根据所述目录索引文件,从设置后的第一文档中提取出符合所述目录索引文件中标题样式对应的内容;
将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
2.如权利要求1所述的方法,其特征在于,所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
3.如权利要求1或2所述的方法,其特征在于,所述读取第一文档之前,还包括通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
4.如权利要求1所述的方法,其特征在于,所述根据所述第二文档可识别的标题样式,生成目录索引文件,具体包括:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
5.如权利要求1所述的方法,其特征在于,所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
6.一种应用于文件格式转换场景下的目录生成装置,其特征在于,包括:样式匹配模块、目录索引模块、标题提取模块和目录生成模块;
所述样式匹配模块,用于读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
所述目录索引模块,用于根据所述第二文档可识别的标题样式,生成目录索引文件;
所述标题提取模块,用于根据所述目录索引文件,读取设置后的第一文档,提取出与所述第二文档可识别的标题样式对应的内容;
所述目录生成模块,用于将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
7.如权利要求6所述的装置,其特征在于,所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
8.如权利要求6或7所述的装置,其特征在于,所述样式匹配模块还用于通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
9.如权利要求6所述的装置,其特征在于,所述目录索引模块还用于:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
10.如权利要求6所述的装置,其特征在于,所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510390513.2/1.html,转载请声明来源钻瓜专利网。