[发明专利]文本相似度计算模型的更新方法、装置、设备及存储介质有效
申请号: | 202110704233.X | 申请日: | 2021-06-24 |
公开(公告)号: | CN113283230B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 刘志慧;金培根;陆林炳;林加新 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/33;G06N7/00 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 姚泽鑫 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 相似 计算 模型 更新 方法 装置 设备 存储 介质 | ||
1.一种文本相似度计算模型的更新方法,其特征在于,包括:
引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值,所述第一文本和所述第二文本为输入至所述文本相似度计算模型中进行文本相似度计算的两个文本,其中,计算第一损失值和第二损失值的过程包括:
基于掩膜词预测任务对所述第一文本和所述第二文本分别进行关键词预测处理,获取所述第一文本中的掩膜词对应的预测关键词以及所述第二文本中的掩膜词对应的预测关键词;
根据所述第一文本中的掩膜词对应的预测关键词,通过比对掩膜词与预测关键词之间的相似度,计算出所述第一文本在关键词预测处理过程中产生的损失值作为第一损失值;
根据所述第二文本中的掩膜词对应的预测关键词,通过比对掩膜词语预测关键词之间的相似度,计算出所述第二文本在关键词预测处理过程中产生的损失值作为第二损失值;
获取文本相似度计算模型在计算所述第一文本与所述第二文本之间的文本相似度时产生的第三损失值;
计算出所述第一损失值、所述第二损失值以及所述第三损失值的总和作为总损失值,按照所述总损失值对所述文本相似度计算模型进行迭代更新处理。
2.根据权利要求1所述的文本相似度计算模型的更新方法,其特征在于,所述引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值的步骤中,计算所述第一损失值和第二损失值的过程还包括:
基于序列标注任务对所述第一文本和所述第二文本分别进行关键词提取处理,获取所述第一文本的关键词标注序列和所述第二文本的关键词标注序列;
根据所述第一文本的关键词标注序列,使用预设的条件随机场模型计算出所述第一文本在关键词提取处理过程中产生的损失值作为第一损失值;
根据所述第二文本的关键词标注序列,使用预设的条件随机场模型计算出所述第二文本在关键词提取处理过程中产生的损失值作为第二损失值。
3.根据权利要求1所述的文本相似度计算模型的更新方法,其特征在于,所述基于掩膜词预测任务对所述第一文本和所述第二文本分别进行关键词预测处理,获取所述第一文本中的掩膜词对应的预测关键词以及所述第二文本中的掩膜词对应的预测关键词的步骤,包括:
对于所述第一文本和第二文本中的任一文本,采用预训练的预测模型对所述文本中包含的词语进行随机掩膜获取所述文本的掩膜词,以使所述预训练的预测模型根据所述文本中未被掩膜的词语学习所述掩膜词的含义,并按照所述掩膜词的含义从预设的关键词表中获取与所述掩膜词的含义对应的词语作为所述掩膜词对应的预测关键词。
4.根据权利要求1所述的文本相似度计算模型的更新方法,其特征在于,所述获取文本相似度计算模型在计算所述第一文本与所述第二文本之间的文本相似度时产生的第三损失值的步骤,包括:
基于所述文本相似度计算模型构建交叉熵函数,根据所述交叉熵函数计算所述文本相似度计算模型的损失值,所述损失值表征为所述文本相似度计算模型在计算所述第一文本与所述第二文本之间的文本相似度时产生的第三损失值。
5.根据权利要求1所述的文本相似度计算模型的更新方法,其特征在于,所述计算出所述第一损失值、所述第二损失值以及所述第三损失值的总和作为总损失值,按照所述总损失值对所述文本相似度计算模型进行迭代更新处理的步骤,包括:
初始化配置所述关键词识别任务对应的损失计算权重和所述文本相似度计算模型本身对应的损失计算权重;
按照所述初始化配置的损失计算权重对所述第一损失值、所述第二损失值以及所述第三损失值进行加权求和,获得总损失值,按照所述总损失值对所述文本相似度计算模型进行迭代更新处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704233.X/1.html,转载请声明来源钻瓜专利网。