[发明专利]相似度预测模型训练方法、设备及计算机可读存储介质有效
申请号: | 201811187519.X | 申请日: | 2018-10-11 |
公开(公告)号: | CN109284399B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 张超;杨海军;徐倩;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/211;G06F40/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国;魏兰 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似 预测 模型 训练 方法 设备 计算机 可读 存储 介质 | ||
1.一种相似度预测模型训练方法,其特征在于,所述相似度预测模型训练方法包括以下步骤:
当监测到模型训练指令时,对第一样本数据库中的各组语句文本语料进行相似度标注,以获取语句文本标注语料集;
对第一样本数据库中的各组语句文本语料进行句法语义分析,以将所述语句文本标注语料集转换为模式文本标注语料集;
依据所述模式文本标注语料集,训练相似度预测模型,直至所述相似度预测模型收敛;
所述对第一样本数据库中的各组语句文本语料进行句法语义分析,以将所述语句文本标注语料集转换为模式文本标注语料集的步骤包括:
对第一样本数据库中的各组语句文本语料进行句法语义分析,抽象出各组语句文本语料对应的语句表述模式,语句表述模式中包括必选部分,所述必选部分中包括一个或多个任选部分,所述任选部分通过同义词扩充得到,或通过词性或本体概念抽象出同类词得到,将各组语句文本语料转换为对应的语句表述模式,形成模式文本语料集;
依据所述语句文本标注语料集,对所述模式文本语料集中的各组模式文本语料进行相似度标注,以获取模式文本标注语料集。
2.如权利要求1所述的相似度预测模型训练方法,其特征在于,所述对第一样本数据库中的各组语句文本语料进行相似度标注,以获取语句文本标注语料集的步骤包括:
将第一样本数据库中的各组语句文本语料内的第一语句文本和第二语句文本分别拆分为单个字符,并确定每个字符的字向量;
依据各组语句文本语料中第一语句文本内的每个字符的字向量和第二语句文本内的每个字符的字向量,确定各组语句文本语料的相似度;
依据各组语句文本语料的相似度,对各组语句文本语料进行标注,以获取语句文本标注语料集。
3.如权利要求2所述的相似度预测模型训练方法,其特征在于,所述依据各组语句文本语料中第一语句文本内的每个字符的字向量和第二语句文本内的每个字符的字向量,确定各组语句文本语料的相似度的步骤包括:
依据各组语句文本语料中第一语句文本内的每个字符的字向量和第二语句文本内的每个字符的字向量,确定各组语句文本语料中第一语句文本的文本向量和第二语句文本的文本向量;
计算各组语句文本语料中第一语句文本的文本向量与第二语句文本的文本向量之间的距离,并依据所述距离,确定各组语句文本语料的相似度。
4.如权利要求1-3中任一项所述的相似度预测模型训练方法,其特征在于,依据所述模式文本标注语料集,训练相似度预测模型,直至所述相似度预测模型收敛的步骤之后,还包括:
当监测到相似度预测请求时,对所述相似度预测请求中的两个语句文本进行句法语义分析,以将所述两个语句文本转换为两个模式文本;
将所述两个模式文本输入所述相似度预测模型,获取所述两个语句文本的相似度。
5.如权利要求4所述的相似度预测模型训练方法,其特征在于,将所述两个模式文本输入所述相似度预测模型,获取所述语句文本的相似度的步骤之后,还包括:
依据所述相似度,对所述两个模式文本进行相似度标注,得到模式文本标注语料组,并将所述模式文本标注语料组存储至第二样本数据库中。
6.如权利要求5所述的相似度预测模型训练方法,其特征在于,将所述模式文本标注语料组存储至第二样本数据库中的步骤之后,还包括:
以间隔预设时间统计所述第二样本数据库中模式文本标注语料组的存储数量,并判断所述存储数量是否大于或等于预设阈值;
若所述存储数量大于或等于预设阈值,则依据所述第一样本数据库和所述第二样本数据库,执行相似度预测模型更新操作。
7.如权利要求6所述的相似度预测模型训练方法,其特征在于,依据所述第一样本数据库和所述第二样本数据库,执行相似度预测模型更新操作的步骤包括:
将所述第一样本数据库中的各组模式文本标注语料与所述第二样本数据库中的各组模式文本标注语料合并,形成模式文本标注语料集;
初始化所述相似度预测模型,并依据所述模式文本标注语料集,训练经初始化后的相似度预测模型,直至初始化后的相似度预测模型收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811187519.X/1.html,转载请声明来源钻瓜专利网。