[发明专利]文本相似度计算模型的更新方法、装置、设备及存储介质有效
申请号: | 202110704233.X | 申请日: | 2021-06-24 |
公开(公告)号: | CN113283230B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 刘志慧;金培根;陆林炳;林加新 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/33;G06N7/00 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 姚泽鑫 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 相似 计算 模型 更新 方法 装置 设备 存储 介质 | ||
本申请适用于人工智能技术领域,提供一种文本相似度计算模型的更新方法、装置、设备及存储介质,方法包括:引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值,第一文本和第二文本为输入至文本相似度计算模型中进行文本相似度计算的两个文本;获取文本相似度计算模型在计算第一文本与第二文本之间的文本相似度时产生的第三损失值;计算出第一损失值、第二损失值以及第三损失值的总和作为总损失值,按照总损失值对文本相似度计算模型进行迭代更新处理。该方法通过引入关键词识别任务,可以增强模型的迭代更新效果,快速地提升文本相似度计算模型的计算准确率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种文本相似度计算模型的更新方法、装置、设备及存储介质。
背景技术
文本相似技术在搜索、推荐、FAQ等领域中有着广泛的应用。由于深度学习文本相似度技术大部分都是采用单任务进行训练,目前现有的一些文本相似度计算模型通常都是通过模型本身的损失来对模型进行迭代更新的,而发明人发现,通过此种方式进行模型迭代更新时,效果不明显,无法快速地提升相似度计算任务的准确率。
发明内容
有鉴于此,本申请实施例提供了一种文本相似度计算模型的更新方法、装置、设备及存储介质,可以通过引入关键词识别任务,增强文本相似度识别模型的迭代更新效果,实现快速地提升相似度计算的准确率。
本申请实施例的第一方面提供了一种文本相似度计算模型的更新方法,包括:
引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值,所述第一文本和所述第二文本为输入至所述文本相似度计算模型中进行文本相似度计算的两个文本;
获取文本相似度计算模型在计算所述第一文本与所述第二文本之间的文本相似度时产生的第三损失值;
计算出所述第一损失值、所述第二损失值以及所述第三损失值的总和作为总损失值,按照所述总损失值对所述文本相似度计算模型进行迭代更新处理。
结合第一方面,在第一方面的第一种可能实现方式中,所述引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值的步骤中,所述关键词识别任务被配置为关键词提取任务或关键词预测任务。
结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,若所述关键词识别任务被配置为关键词提取任务,所述引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值的步骤,包括:
基于序列标注任务对所述第一文本和所述第二文本分别进行关键词提取处理,获取所述第一文本的关键词标注序列和所述第二文本的关键词标注序列;
根据所述第一文本的关键词标注序列,使用预设的条件随机场算法模型计算出所述第一文本在关键词提取处理过程中产生的损失值作为第一损失值;
根据所述第二文本的关键词标注序列,使用预设的条件随机场算法模型计算出所述第二文本在关键词提取处理过程中产生的损失值作为第二损失值。
结合第一方面的第一种可能实现方式,在第一方面的第三种可能实现方式中,若所述关键词识别任务被配置为关键词预测任务,所述引入关键词识别任务,分别计算出第一文本在进行关键词识别任务时产生的第一损失值和第二文本在进行关键词识别任务时产生的第二损失值的步骤,包括:
基于掩膜词预测任务对所述第一文本和所述第二文本分别进行关键词预测处理,获取所述第一文本中的掩膜词对应的预测关键词以及所述第二文本中的掩膜词对应的预测关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704233.X/2.html,转载请声明来源钻瓜专利网。