[发明专利]一种可迭代优化的文档分析结果的保存方法有效
申请号: | 201710616485.0 | 申请日: | 2017-07-26 |
公开(公告)号: | CN107368472B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 林鹰;罗康;张鑫阳 | 申请(专利权)人: | 成都科来软件有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/103;G06F40/117 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 项霞 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种可迭代优化的文档分析结果的保存方法。所述方法包括读取原始文档,将原始文档存放到指定目录下的步骤;计算各段单元的ID、MD5值并存储到一个XML文件中的步骤;机器分析步骤;将分析结果按段落ID进行标记的步骤;人工初步验证的步骤。本发明提供了到段落级别的索引能力,并且存储了机器和人工分析结果,能提供更精细的处理能力,并且大大简化了工作量。 | ||
搜索关键词: | 一种 可迭代 优化 文档 分析 结果 保存 方法 | ||
【主权项】:
一种可迭代优化的文档分析结果的保存方法,其特征在于,包括如下步骤:步骤一:读取原始文档,获取原始文档的ID,将原始文档存放到指定目录下;步骤二:对原始文档进行分段,每段为一个段落单元;步骤三:计算每个段落单元的ID、MD5值、当前所采用分段算法的版本号,将各个段落单元的文本内容、ID、MD5值存储到一个XML文件中,所述XML文件与原始文档保存在相同指定目录下;步骤四:按照预定的分析方式并对各个段落单元进行机器分析;步骤五:提取各个段落单元的分析结果,每个分析结果为一个分析单元,并按段落ID进行标记;步骤六:将标记后的分析结果存放到XML文件中;步骤七:按照预定的人工修订方式对分析结果加以初步验证,并将验证结果记录在XML文件的相应分析单元中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都科来软件有限公司,未经成都科来软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710616485.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种获取招标产品信息的方法及装置
- 下一篇:一种组合式投射灯