[发明专利]一种搜索结果处理、相似度模型训练方法及装置有效

申请号：	201811444224.6	申请日：	2018-11-29
公开（公告）号：	CN110162593B	公开（公告）日：	2023-03-21
发明（设计）人：	吴逸峰;颜强;郑文豪;陈晓寅;詹德川	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	郭润湘;李娟
地址：	518044 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种搜索结果处理相似模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及计算机技术领域，尤其涉及一种搜索结果处理、相似度模型训练方法及装置，根据搜索关键词获取各搜索结果；分别获得各搜索结果的精确匹配分数；分别确定各搜索结果的语义匹配权重向量、以及搜索关键词与各搜索结果的语义表示向量，并根据确定的各语义表示向量和相应的语义匹配权重向量，获得各搜索结果的语义匹配分数；根据各搜索结果的精确匹配分数和语义匹配分数，获得各搜索结果与所述搜索关键词的相似度，这样，可以通过语义匹配权重向量，调整语义匹配和精确匹配对最终相似度的影响，提高相似度结果准确性，更加满足用户实际搜索需求。

技术领域

本发明涉及计算机技术领域，尤其涉及一种搜索结果处理、相似度模型训练方法及装置。

背景技术

随着互联网的发展，用户通过查询搜索，就可以获取到所需的信息，但是，用户搜索需求多样，并且互联网中资源非常多，通过搜索后的搜索结果可能也会很多，为减少用户时间和便于查看，就需要对搜索结果进行排序，将更符合用户需求的排序靠前。

现有技术中，主要是用户输入搜索关键词后，可以根据搜索关键词获取相应的搜索结果列表，然后通过算法模型进行文本相似度计算，根据相似度得分，进行排序，并返回排序后的搜索结果列表。

但是，现有技术中相似度计算的算法模型，通常都是针对单一搜索需求的应用场景，例如泛需求，没有考虑用户不同的搜索需求，并且忽略了文本语序和上下文的影响，相似度得分较高的搜索结果并不一定符合用户需求，从而导致根据相似度得到排序后的搜索结果列表中，排序靠前的搜索结果并不一定是用户最满意或最想要的结果。

发明内容

本发明实施例提供一种搜索结果处理、相似度模型训练方法及装置，以解决现有技术中搜索结果相似度计算不准确，无法满足用户不同搜索需求的问题。

本发明实施例提供的具体技术方案如下：

本发明一个实施例提供了一种搜索结果处理方法，包括：

根据搜索关键词获取各搜索结果；

分别获得各搜索结果的精确匹配分数；

分别确定各搜索结果的语义匹配权重向量、以及搜索关键词与各搜索结果的语义表示向量，并根据确定的各语义表示向量和相应的语义匹配权重向量，获得各搜索结果的语义匹配分数；

根据各搜索结果的精确匹配分数和语义匹配分数，获得各搜索结果与所述搜索关键词的相似度。

本发明另一个实施例提供了一种相似度模型训练方法，用于训练上述实施例中的相似度模型，包括：

获取初始训练样本集；

根据所述初始训练样本集，构建二元组数据训练集，并根据所述二元组数据训练集，第一训练相似度模型，获得第一训练后的相似度模型；其中，二元组数据训练集中每个二元组数据至少包括搜索关键词、搜索结果、以及表征搜索关键词与搜索结果是否相似的标签；

根据所述初始训练样本集，构建三元组数据训练集，并根据所述三元组数据训练集，第二训练获得的第一训练后的相似度模型，获得第二训练后的相似度模型；其中，三元组数据训练集中每个三元组数据至少包括搜索关键词、第一搜索结果、第二搜索结果，并且搜索关键词与第一搜索结果的相似度，大于搜索关键词与第二搜索结果的相似度。

本发明另一个实施例提供了一种搜索结果处理装置，包括：

获取模块，用于根据搜索关键词获取各搜索结果；

精确匹配模块，用于分别获得各搜索结果的精确匹配分数；

语义匹配模块，用于分别确定各搜索结果的语义匹配权重向量、以及搜索关键词与各搜索结果的语义表示向量，并根据确定的各语义表示向量和相应的语义匹配权重向量，获得各搜索结果的语义匹配分数；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811444224.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于万有引力改进的TextRank的新闻关键词提取方法
下一篇：文本数据的观点生成方法、装置及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种搜索结果处理、相似度模型训练方法及装置有效

专利文献下载