[发明专利]合同文件的标签标记方法、装置、计算机装置及存储介质有效
申请号: | 201910173513.5 | 申请日: | 2019-03-07 |
公开(公告)号: | CN109992752B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 刘玉强;方俊波;鄢真;杨昊燃;李雯;叶素兰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/166;G06Q40/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 周志伟 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合同 文件 标签 标记 方法 装置 计算机 存储 介质 | ||
1.一种合同文件的标签标记方法,应用于一计算机装置中,其特征在于,所述合同文件的标签标记方法包括:
将所述合同文件划分为多个预设的文件组成部分;
判断所述合同文件的类型,每一类型对应需进行标签标记的至少一文件组成部分;
确定每一需进行标签标记的文件组成部分所对应的标签集,所述标签集为预定义标签集以及自定义标签集中的一种,所述预定义标签集包括多个预定义标签;
判断每一文件组成部分所对应的标签集为预定义标签集或自定义标签集;
当其中一文件组成部分所对应的标签集为预定义标签集时,从所述合同文件中定位所述预定义标签集中每一预定义标签的位置,并将所述预定义标签标记至与所述位置对应的段落;
当其中一文件组成部分所对应的标签集为自定义标签集时,从所述文件组成部分中识别核心关键词,将所述核心关键词作为自定义标签标记至所述核心关键词所在的段落,并将所述核心关键词加入所述自定义标签集中;以及
将所述预定义标签集以及所述自定义标签集合并为新的标签集,所述新的标签集对应合同文件的其中一类型,使得所述计算机装置可使用所述新的标签集对同一类型的其它合同文件进行标记。
2.如权利要求1所述的合同文件的标签标记方法,其特征在于,所述将所述预定义标签标记至与所述位置对应的段落之后,还包括以下步骤:
提取每一预定义标签所在的位置后对应的文本内容,并将所提取的文本内容与所述预定义标签相关联。
3.如权利要求2所述的合同文件的标签标记方法,其特征在于,所述提取每一预定义标签所在的位置后对应的文本内容具体包括:
在从所述合同文件中定位所确定的标签集中每一预定义标签的位置后,识别所述预定义标签之后位于同一段落的合同内容;
对所述合同内容进行语言逻辑关系分析,从而将所述预定义标签后的合同内容拆分为至少一词语单元;以及
将符合最所述预定义标签的语义的词语单元作为所述预定义标签对应的所述文本内容提取出来。
4.如权利要求1所述的合同文件的标签标记方法,其特征在于,所述从所述文件组成部分中识别核心关键词具体包括:
过滤所述文件组成部分中包括标点和特殊符号在内的非用词;
对过滤后的所述文件组成部分进行语言逻辑关系分析,从而将所述文件组成部分拆分为多个词语单元;以及
将能够体现所述文件组成部分的结论和意义的至少一词语单元作为所述核心关键词。
5.如权利要求1所述的合同文件的标签标记方法,其特征在于,所述将所述核心关键词作为自定义标签标记至所述核心关键词所在的段落之后,还包括以下步骤:
提取每一核心关键词所在的位置后对应的文本内容,并将所提取的文本内容与所述自定义标签相关联。
6.如权利要求1所述的合同文件的标签标记方法,其特征在于,所述使用所述新的标签集对同一类型的其它合同文件进行标记包括:
判断当前需进行标签标记的合同文件的类型;
判断所述类型是否与所述新的标签集对应的类型一致;以及
当所述类型与所述新的标签集对应的类型一致时,使用所述新的标签集对所述合同文件进行标记。
7.如权利要求1所述的合同文件的标签标记方法,其特征在于,所述计算机装置中存储有所述合同文件的不同类型、需进行标签标记的至少一文件组成部分以及标签集之间的对应关系,其中,每一类型对应需要进行标签标记的至少一文件组成部分,每一文件组成部分对应一标签集,所述每一需进行标签标记的文件组成部分所对应的标签集为根据所述对应关系确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910173513.5/1.html,转载请声明来源钻瓜专利网。