[发明专利]合同相对方信息的结构化方法及装置在审
| 申请号: | 201910838971.6 | 申请日: | 2019-09-05 |
| 公开(公告)号: | CN110765188A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 任宁;晋耀红;李德彦 | 申请(专利权)人: | 中科鼎富(北京)科技发展有限公司 |
| 主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/35;G06Q50/18 |
| 代理公司: | 11363 北京弘权知识产权代理事务所(普通合伙) | 代理人: | 逯长明;许伟群 |
| 地址: | 100089 北京市海淀区万*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 属性信息 内容区块 审核 目标行 归类 结构化处理 合同文本 机器辅助 所属关系 结构化 合同 抽取 申请 | ||
1.一种合同相对方信息的结构化方法,其特征在于,所述方法包括:
利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息;
按照所述属性信息,将所述内容区块切分成若干目标行,每一所述目标行与一条属性信息对应;
从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。
2.根据权利要求1所述的方法,其特征在于,所述利用预设目录树从合同文本中抽取至少一个内容区块,包括:
获取所述合同文本所属的情形,所述情形至少包括第一情形和第二情形,所述第一情形中包括至少两个相对方主体,不同相对方主体的属性信息同行,所述第二情形中包括至少两个相对方主体,每个相对方主体的至少一条属性信息单独成行;
根据所述合同文本所属的情形,选择用于从合同文本中抽取所述内容区块的目录节点,所述目录节点包括至少一个抽取表达式;
利用选择的目录节点从所述合同文本中抽取至少一个所述内容区块。
3.根据权利要求2所述的方法,其特征在于,所述按照属性信息,将所述内容区块切分成若干目标行,包括:
利用预设目录树识别所述内容区块中包含一条以上属性信息的行;
对于识别出的包含一条以上属性信息的行,在每一条属性信息的首部或者尾部设置切分点;
对于识别出的未包含一条以上属性信息的行,在所述行的首部或者尾部设置切分点;
按照设置的所述切分点,将所述内容区块切分成若干目标行。
4.根据权利要求3所述的方法,其特征在于,所述利用预设目录树识别所述内容区块中包含一条以上属性信息的行,包括:
如果所述合同文本所属的情形为第二情形,则利用预设目录树识别所述内容区块中包含一条以上属性信息的行。
5.根据权利要求2所述的方法,其特征在于,所述从若干目标行中分别提取出每个相对方主体的属性信息,包括:
按照所述属性信息在所述合同文本中的位置顺序,对所述目标行进行排序;
如果所述合同文本所属的情形为第一情形,则获取所述第一情形预设的第一提取规则;
使用所述第一提取规则从排序后的目标行中提取出与每个相对方主体的属性信息对应的目标行;
如果所述合同文本所属的情形为第二情形,则获取所述第二情形预设的第二提取规则;
使用所述第二提取规则从排序后的目标行中提取出与每个相对方主体的属性信息对应的目标行。
6.一种合同相对方信息的结构化处理装置,其特征在于,所述装置包括:
抽取模块,用于利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息;
切分模块,用于按照所述属性信息,将所述内容区块切分成若干目标行,每一所述目标行与一条属性信息对应;
归类模块,用于从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。
7.根据权利要求6所述的装置,其特征在于,所述抽取模块,包括:
获取单元,用于获取所述合同文本所属的情形,所述情形至少包括第一情形和第二情形,所述第一情形中包括至少两个相对方主体,不同相对方主体的属性信息同行,所述第二情形中包括至少两个相对方主体,每个相对方主体的至少一条属性信息单独成行;
选择单元,用于根据所述合同文本所属的情形,选择用于从合同文本中抽取所述内容区块的目录节点,所述目录节点包括至少一个抽取表达式;
抽取单元,用于利用选择的目录节点从所述合同文本中抽取至少一个所述内容区块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科鼎富(北京)科技发展有限公司,未经中科鼎富(北京)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910838971.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据源路由管理方法和装置
- 下一篇:互联网产品的异常管理方法和系统





