[发明专利]对象匹配方法、模型训练方法、产品匹配方法和存储介质在审
申请号: | 202210435314.9 | 申请日: | 2022-04-24 |
公开(公告)号: | CN114860874A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 陈犇;金林波;蒋文 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/166;G06F40/295;G06N3/08 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;李静茹 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 匹配 方法 模型 训练 产品 存储 介质 | ||
本申请公开了一种对象匹配方法、模型训练方法、产品匹配方法和存储介质。其中,该方法包括:获取对象搜索请求和目标对象的描述信息;利用语义匹配模型对多个检索关键词和描述信息进行语义匹配,得到对象搜索请求与目标对象的目标匹配结果。本申请在模型的训练过程中借助对抗训练提升模型对关键词堆叠文本冗余信息的抗干扰能力,而且,在对抗训练的过程中融合了对比学习增强模型对正负样本的区分,提升对象搜索请求和目标对象的描述信息的表征能力,从而可以达到提高语义匹配模型对细微语义的识别能力并提高鲁棒性,进而达到提高模型识别准确率的技术效果,解决了现有技术中语义匹配模型识别准确率较低的技术问题。
技术领域
本申请涉及语义识别领域,具体而言,涉及一种对象匹配方法、模型训练方法、产品匹配方法和存储介质。
背景技术
语义匹配作为搜索领域的重要部分,可以使得每次用户的搜索结果与用户输入的搜索文本相关,为达到较好的用户搜索体验效果,通常采用基于Transformer(Transformer是一个基于注意力机制的模型)的预训练模型进行语义匹配。
但是,基于Transformer的预训练模型通常是在大规模通用预料上所训练得到的,不能很好的适配考虑细微语义差异的场景,例如,在线购物场景中,用户输入的搜索文本为“300ml健身水杯”的情况下,搜索结果会将各种容积的水杯排列在前,显示给用户,而并不关注水杯的容积是300ml。并且,用户输入的搜索文本通常并非完整的句子,而是关键词的叠加,一些语序的变化,可能会造成模型匹配出错误的结果。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种对象匹配方法、模型训练方法、产品匹配方法和存储介质,以至少解决相关技术中的语义匹配准确率低的技术问题。
根据本申请实施例的一个方面,提供了一种对象匹配方法,包括:获取对象搜索请求和目标对象的描述信息,其中,对象搜索请求由多个检索关键词叠加生成;利用语义匹配模型对多个检索关键词和描述信息进行语义匹配,得到对象搜索请求与目标对象的目标匹配结果,其中,语义匹配模型通过训练样本的第一匹配结果和对抗样本的第二匹配结果对预训练模型进行训练得到,对抗样本通过在训练样本上叠加噪声数据生成,第一匹配结果通过第一匹配模型对训练样本进行处理所得到,第二匹配结果通过第二匹配模型对对抗样本进行处理所得到,第一匹配模型和第二匹配模型分别采用两个不同的丢弃率对预训练模型中的部分神经元进行丢弃所得到。
根据本申请实施例的另一方面,还提供了一种对象匹配方法,包括:云服务器接收客户端发送的对象搜索请求,其中,对象搜索请求由多个检索关键词叠加生成;云服务器基于对象搜索请求获取目标对象的描述信息;云服务器利用语义匹配模型对多个检索关键词和描述信息进行语义匹配,得到对象搜索请求与目标对象的目标匹配结果,其中,语义匹配模型通过训练样本的第一匹配结果和对抗样本的第二匹配结果对预训练模型进行训练得到,对抗样本通过在训练样本上叠加噪声数据生成,第一匹配结果通过第一匹配模型对训练样本进行处理所得到,第二匹配结果通过第二匹配模型对对抗样本进行处理所得到,第一匹配模型和第二匹配模型分别采用两个不同的丢弃率对预训练模型中的部分神经元进行丢弃所得到;云服务器输出目标匹配结果至客户端。
根据本申请实施例的另一方面,还提供了一种产品匹配方法,包括:获取产品搜索请求和目标产品的标题信息,其中,产品搜索请求由多个检索关键词叠加生成;利用语义匹配模型对多个检索关键词和标题信息进行语义匹配,得到产品搜索请求与目标产品的目标匹配结果,其中,语义匹配模型通过训练样本的第一匹配结果和对抗样本的第二匹配结果对预训练模型进行训练得到,对抗样本通过在训练样本上叠加噪声数据生成,第一匹配结果通过第一匹配模型对训练样本进行处理所得到,第二匹配结果通过第二匹配模型对对抗样本进行处理所得到,第一匹配模型和第二匹配模型分别采用两个不同的丢弃率对预训练模型中的部分神经元进行丢弃所得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210435314.9/2.html,转载请声明来源钻瓜专利网。