[发明专利]基于深度学习和统计提取模型的智能合同信息提取方法有效
| 申请号: | 201910902257.9 | 申请日: | 2019-09-24 |
| 公开(公告)号: | CN110674254B | 公开(公告)日: | 2023-03-10 |
| 发明(设计)人: | 于志文;刘大伟;何晓晴;周玲;蒋路 | 申请(专利权)人: | 中电鸿信信息科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33 |
| 代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 陈亮亮 |
| 地址: | 210000 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于深度学习和统计提取模型的智能合同信息提取方法,读取各种类型合同文档中的字段,针对不同类型信息采用不同信息提取方法将合同信息分成两种格式:已写明标准信息格式和未写明语义理解型格式;对两种信息格式分别建立提取模型,根据上述的训练模型,对文本中包含的信息,采用已写明标准信息提取模型,对信息进行提取;对未写明语义理解型采用先信息定位再通过深度学习模型提取信息。本发明实现合同中关键信息的提取,对合同中不同类型的信息采用不同的信息提取方法,实现合同非规整数据向结构化数据转变,提高公司的精细化管理水平。 | ||
| 搜索关键词: | 基于 深度 学习 统计 提取 模型 智能 合同 信息 方法 | ||
【主权项】:
1.一种基于深度学习和统计提取模型的智能合同信息提取方法,其特征在于包含以下步骤:/n步骤一:合同读取,读取各种类型合同文档中的字段;/n步骤二:针对不同类型信息采用不同信息提取方法,按照合同中是否写明,将合同信息分成两种格式:已写明标准信息格式和未写明语义理解型格式;/n步骤三:针对已写明标准信息格式,通过训练数据,建立合同信息提取模型,训练获得包含词、前置词、后置词、分隔词,以及对应的置信度,实现信息提取;/n步骤四:针对未写明语义理解型格式,根据训练数据获得判断依据信息的提取模型,实现判断依据信息的定位,再通过深度学习技术,实现语义理解型格式的信息提取;/n步骤五:根据上述的训练模型,对文本中包含的信息,采用已写明标准信息提取模型,对信息进行提取;对未写明语义理解型采用先信息定位再通过深度学习模型提取信息。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电鸿信信息科技有限公司,未经中电鸿信信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910902257.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种语义处理方法及设备
- 下一篇:文本内容审核方法及装置





