[发明专利]一种结构化文档的生成方法、装置及存储介质在审
申请号: | 201811640368.9 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109783787A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张海勇 | 申请(专利权)人: | 远光软件股份有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/22 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 519000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 财务制度 结构化文档 文档 存储介质 文本 结构文档 人力成本 文档模板 文档转换 预设格式 知识信息 指令信息 预设 申请 | ||
本申请公开了一种结构化文档的生成方法、装置及存储介质,该方法包括获取预设格式的待处理财务制度文档,对待处理财务制度文档进行段落划分处理,将待处理财务制度文档划分为以段落为单元的段落文本;获取段落文本对应的关键词;将关键词作为指令信息、将关键词对应的段落文本作为知识信息输入至预设的文档模板,以生成结构化文档。通过上述方案,可实现快速将财务制度文档转换为结构文档,节省人力成本。
技术领域
本申请涉及文档处理领域,特别是涉及一种结构化文档的生成方法、装置及存储介质。
背景技术
在企业单位的日常管理中,会有各种各样的财务方面制度文件或决策文件产生,且会随着企业单位的发展修改或更新,如何快速将这些财务方面的制度文件快速有效有条理地导入至企业知识库是企业目前面临的困难。而在现有技术中,则多是采用人工进行抽取和编辑,然后输入至企业知识库中,由于这样会占用大量的人力,且由于人工处理过程中完全靠人工操作是会有较高出错风险,故需要一种可以解决上述技术问题的方案。
发明内容
本申请主要解决的技术问题是提供一种可快速生成结构化文档的方法。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种结构化文档的生成方法,所述方法包括:
获取预设格式的待处理财务制度文档;
对所述待处理财务制度文档进行段落划分处理,将所述待处理财务制度文档划分为以段落为单元的段落文本;
获取所述段落文本对应的关键词;
将所述关键词作为指令信息、将所述关键词对应的所述段落文本作为知识信息输入至预设的文档模板,以生成结构化文档。
为解决上述技术问题,本申请采用的另一个技术方案是,提供一种结构化文档的生成装置,所述装置包括相互连接的处理器和存储器;
其中,所述存储器用于存储程序数据;
所述处理器用于运行所述程序数据,以执行如上所述的结构化文档的生成方法。
为解决上述技术问题,本申请采用的又一个技术问题是,提供一种存储介质,所述存储介质存储有程序数据,所述程序数据被执行时实现如上所述的结构化文档的生成方法。
以上方案,通过对所获取的待处理财务制度文档进行段落划分处理,以将待处理财务制度文档划分为以段落为单元的段落文本,获取段落文本对应的关键词,将关键词作为指令信息、将关键词对应的段落文本作为知识信息输入至预设的文档模板,生成结构化文档,在此过程中无需人工操作,仅基于机器即可基于财务制度文档快速生成结构化文档,提高了结构化文档的生成效率。
附图说明
图1是本申请一种结构化文档的生成方法一实施例中的流程示意图;
图2是本申请一种结构化文档的生成方法另一实施例中的流程示意图;
图3是本申请一种结构化文档的生成方法又一实施例的流程示意图;
图4是本申请一种结构化文档的生成装置一实施例中的结构示意图;
图5是本申请一种存储介质一实施例中的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于远光软件股份有限公司,未经远光软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811640368.9/2.html,转载请声明来源钻瓜专利网。