[发明专利]合同文件的标签标记方法、装置、计算机装置及存储介质有效
申请号: | 201910173513.5 | 申请日: | 2019-03-07 |
公开(公告)号: | CN109992752B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 刘玉强;方俊波;鄢真;杨昊燃;李雯;叶素兰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/166;G06Q40/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 周志伟 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合同 文件 标签 标记 方法 装置 计算机 存储 介质 | ||
一种合同文件的标签标记方法包括:判断合同文件的类型,每一类型对应需进行标签标记的至少一文件组成部分;确定每一需进行标签标记的文件组成部分所对应的标签集;判断标签集为预定义或自定义标签集;当为预定义标签集时,从合同文件中定位预定义标签集中每一预定义标签的位置,并将预定义标签标记至与所述位置对应的段落;否则,从文件组成部分中识别核心关键词,将核心关键词作为自定义标签标记至核心关键词所在的段落,并将核心关键词加入自定义标签集中;将预定义及自定义标签集合并为新的标签集。本发明还提供一种合同文件的标签标记装置、计算机装置及存储介质,有利于保障标签的输出客观准确,提高样本处理效率。
技术领域
本发明涉及计算机技术领域,具体涉及一种合同文件的标签标记方法、合同文件的标签标记装置、计算机装置及计算机可读存储介质。
背景技术
目前越来越多的交易活动都需要签订合同。一些交易在签订合同时,会涉及到很多条目信息,且条目信息由于交易的不同而存在区别,因此需要投入大量的人力物力财力对合同进行分类打标签。然而,由于人工打标签一方面需要该领域的业务人员参与,另一方面,不同阅历的业务人员对同一问题的认知不同,因此人工打标签会受到个人主观因素的影响较强,没有统一的标准。再者,人工打标签需要花费大量的时间,且准确性难以保障,同时需要大量的时间。
发明内容
鉴于以上内容,有必要提出一种合同文件的标签标记方法及装置、计算机装置和计算机可读存储介质,从而解决以上问题。
本申请的第一方面提供一种应合同文件的标签标记方法,应用于一计算机装置中,所述方法包括:
将所述合同文件划分为多个预设的文件组成部分;
判断所述合同文件的类型,每一类型对应需进行标签标记的至少一文件组成部分;
确定每一需进行标签标记的文件组成部分所对应的标签集,所述标签集为预定义标签集以及自定义标签集中的一种,所述预定义标签集包括多个预定义标签;
判断每一文件组成部分所对应的标签集为预定义标签集或自定义标签集;
当其中一文件组成部分所对应的标签集为预定义标签集时,从所述合同文件中定位所述预定义标签集中每一预定义标签的位置,并将所述预定义标签标记至与所述位置对应的段落;
当其中一文件组成部分所对应的标签集为自定义标签集时,从所述文件组成部分中识别核心关键词,将所述核心关键词作为自定义标签标记至所述核心关键词所在的段落,并将所述核心关键词加入所述自定义标签集中;以及
将所述预定义标签集以及所述自定义标签集合并为新的标签集,所述新的标签集对应合同文件的其中一类型,使得所述计算机装置可使用所述新的标签集对同一类型的其它合同文件进行标记。
本申请的第二方面提供一种合同文件的标签标记装置,所述装置包括:
划分模块,用于将所述合同文件划分为多个预设的文件组成部分;
第一判断模块,用于判断所述合同文件的类型,每一类型对应需进行标签标记的至少一文件组成部分;
确定模块,用于确定每一需进行标签标记的文件组成部分所对应的标签集,所述标签集为预定义标签集以及自定义标签集中的一种,所述预定义标签集包括多个预定义标签;
第二判断模块,用于判断每一文件组成部分所对应的标签集为预定义标签集或自定义标签集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910173513.5/2.html,转载请声明来源钻瓜专利网。