[发明专利]一种提取限定词的方法、系统及电子设备在审
申请号: | 202211505584.9 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115859966A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 陈银;吕晓;陈立力;周明伟 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/289;G06F18/214;G06N20/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 潘平 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提取 限定词 方法 系统 电子设备 | ||
1.一种提取限定词的方法,其特征在于,所述方法包括:
获取当前业务信息表中的N个数据项,其中,N是大于零的整数;
按照数据项处理操作对所述N个数据项进行属性转化,得到N个输入文本;
将所述N个输入文本输入目标模型,得到所述N个数据项各自对应的第一限定词;
通过过滤所述N个数据项各自对应的第一限定词中的预设内容,确定所述N个数据项各自对应的目标限定词,提取所述N个数据项各自对应的目标限定词。
2.如权利要求1所述的方法,其特征在于,在所述获取当前业务信息表中的N个数据项前,还包括:
获取历史业务信息表中的M个数据项,其中,M是大于零的整数;
按照数据项处理操作对所述M个数据项进行属性转化,得到M个训练文本;
通过所述M个训练文本训练第一模型,得到第二模型,其中,所述第一模型是深度学习模型;
若所述第二模型符合第一预设条件,将所述第二模型作为目标模型。
3.如权利要求1所述的方法,其特征在于,所述按照数据项处理操作对所述N个数据项进行属性转化,得到N个输入文本,包括:
针对所述N个数据项中的每一个数据项,均执行以下数据项处理操作:
获取数据项中的中文字段以及数据元;
过滤所述中文字段中的第一指定数据,得到第一中文字段;
基于所述目标模型中的数据属性,将所述数据元以及所述第一中文字段转化为词向量格式的输入文本;
在对所述N个数据项中的每一个数据项均执行所述数据项处理操作后,得到N个输入文本。
4.如权利要求3所述的方法,其特征在于,所述过滤所述中文字段中的第一指定数据,包括:
判断所述中文字段是否包含英文;
若是,通过中文释义映射将所述英文中的第二指定数据转化为中文,得到第二中文字段,过滤所述第二中文字段中的第一指定数据;
若否,过滤所述中文字段中的所述第一指定数据。
5.如权利要求3所述的方法,其特征在于,所述将所述数据元以及所述第一中文字段转化为词向量格式的输入文本,包括:
判断所述数据元以及所述第一中文字段是否符合第二预设条件;
若是,将所述数据元以及所述第一中文字段共同对应的数据项标记为指定数据项,并将所述数据元以及所述第一中文字段转化为词向量格式的输入文本;
若否,将所述数据元以及所述第一中文字段转化为词向量格式的输入文本。
6.如权利要求1所述的方法,其特征在于,在所述提取所述N个数据项各自对应的目标限定词后,还包括:
针对所述N个数据项中的每一个数据项,均执行以下命名操作:
判断数据项是否为指定数据项;
若是,过滤所述数据项,确定所述数据项对应的名称预测值为空;
若否,基于所述数据项对应的数据元以及所述数据项对应的目标限定词,确定所述数据项对应的名称预测值;
在对所述N个数据项中的每一个数据项均执行所述命名操作后,得到所述N个数据项各自对应的名称预测值。
7.一种提取限定词的系统,其特征在于,所述系统包括:
获取模块,用于获取当前业务信息表中的N个数据项,其中,N是大于零的整数;
数据项处理模块,用于按照数据项处理操作对所述N个数据项进行属性转化,得到N个输入文本;
预测模块,用于将所述N个输入文本输入目标模型,得到所述N个数据项各自对应的第一限定词;
处理模块,用于通过过滤所述N个数据项各自对应的第一限定词中的预设内容,确定所述N个数据项各自对应的目标限定词,提取所述N个数据项各自对应的目标限定词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211505584.9/1.html,转载请声明来源钻瓜专利网。