[发明专利]多模态获取监管识别结果的方法、装置、设备及存储介质在审
| 申请号: | 202010149510.0 | 申请日: | 2020-03-06 |
| 公开(公告)号: | CN111428044A | 公开(公告)日: | 2020-07-17 |
| 发明(设计)人: | 孙梦轩;吴岸城 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/295;G06F40/30;G06F40/216;G06F40/211;G06F40/284 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
| 地址: | 518033 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多模态 获取 监管 识别 结果 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能领域,公开了一种多模态获取监管识别结果的方法、装置、设备及存储介质,解决目前业务监管条款和业务产品的语义相似度匹配问题。本申请方法包括:创建知识图谱;根据第一预设规则、第二预设规则和实体关系文件对知识图谱进行处理得到实体和实体关系;根据实体和实体关系更新知识图谱得到目标知识图谱;通过编码器对目标知识图谱和训练文本进行分析获得融合待处理信息;按照预设策略对融合待处理信息进行随机掩面处理获得训练数据;对训练数据进行词嵌入向量处理和自制力机制处理得到目标句向量和目标词向量;按照预设权重比例计算目标句向量和目标词向量的语义余弦相似度和字符串相似度的加权平均值,获得监管识别结果。
技术领域
本申请涉及自然语言处理领域,尤其涉及多模态获取监管识别结果的方法、装置、设备及存储介质。
背景技术
一些特定领域的业务产品只能通过人工审核进行监管条款识别。人工审核不仅费时费力还存在误判的可能。为解决人工审核存在的误判和管理问题,对业务条款的审核采用规则和模式匹配进行筛选和处理,其中,业务条款的审核包括对业务条款中的具体描述和业务产品的描述进行语义上的理解和匹配。
通过规则和模式匹配的筛选和处理进行业务条款的审核存在业务产品情况列举不完全的问题,例如:条款需要确定产品是否有持续交费奖励,仅通过字符搜索时通过根据关键词“业务持续奖励”、“业务交费奖励”进行检索,但是不同产品可能出现的关键词不同,比如:业务持续交费奖励或业务缴费奖励。人工列举的关键词不够充足时就会漏判,而仅靠人工列举关键词既耗费人力,列举不全的可能性又比较大。
目前通过相似Jaccard距离和编辑距离的方法解决业务产品情况列举不完全的问题,但是相似Jaccard距离和编辑距离只能匹配字面相似度,而无法进一步进行语义相似度的匹配,以及无法适应层出不穷的业务新条款的描述变化。
发明内容
本申请提供了一种多模态获取监管识别结果的方法、装置、设备及存储介质,用于采用知识图谱模型、业务实体识别模型和Bert模型生成句向量,按照预设权重计算句向量的语义余弦相似度和字符串相似度的加权平均值,得到加权平均值满足条件对应的业务监管条款的监管识别结果,解决目前业务监管条款和业务产品的语义相似度匹配问题,增强监管审核的泛化能力。
本申请实施例的第一方面提供一种多模态获取监管识别结果的方法,包括:
通过预置的知识图谱模型和业务知识体系创建业务产品待识别文本和业务规定条款信息的知识图谱;
调用预置的业务实体识别模型根据第一预设规则对所述知识图谱进行实体识别,得到实体,所述第一预设规则用于定位条款对应的段落和匹配条款对应的语句;
根据第二预设规则从预置的实体关系文件中提取所述实体的实体关系,所述实体关系文件包括已有的业务条款、业务产品说明书和业务产品关联信息;
根据所述实体和所述实体关系更新所述知识图谱,得到目标知识图谱;
通过语言Bert模型中的第一编码器和第二编码器对所述目标知识图谱和训练文本进行分析处理,获得融合待处理信息,所述第二编码器包括两个输入口和两个输出口,所述训练文本为各预设领域的业务类型对应的多种文本;
按照预设策略对所述融合待处理信息进行随机掩面处理,获得训练数据;
对所述训练数据进行处理,得到目标句向量和目标词向量,所述目标句向量为业务产品待识别文本的句向量,所述目标词向量为业务规定条款的词向量;
计算所述目标句向量和所述目标词向量之间的语义余弦相似度,以及计算所述业务产品待识别文本和所述业务规定条款信息之间的字符串相似度;
按照预设权重比例计算所述语义余弦相似度和所述字符串相似度的加权平均值,并将大于预设阈值的加权平均值对应的业务规定条款信息作为最终的监管识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010149510.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:实体关系获取方法、装置、设备及存储介质
- 下一篇:电缆收放结构及行走装置





