[发明专利]搜索引擎中的个性化语义向量模型的训练方法及装置有效

专利信息
申请号: 202110191195.2 申请日: 2021-02-19
公开(公告)号: CN113010771B 公开(公告)日: 2023-08-22
发明(设计)人: 陈咨尧;陈强;梁龙军 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9538;G06F16/951;G06F40/151;G06F40/194;G06F40/30;G06F18/214
代理公司: 北京励诚知识产权代理有限公司 11647 代理人: 赵爽
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索引擎 中的 个性化 语义 向量 模型 训练 方法 装置
【说明书】:

本申请实施例提供了提供一种搜索引擎中的个性化语义向量模型的训练方法及装置,涉及区块链的应用服务技术领域,该训练方法包括:获取第一查询特征和M个文档特征,M>0;将该第一查询特征转换为第一查询向量,并将该M个文档特征分别转换为M个文档向量;基于该第一查询向量和该M个文档向量,以预设的相似度差值作为训练目标,训练个性化语义向量模型。本申请提供的训练方法,通过个性化语义向量模型,能够考虑用户输入的词句在语义上的相关性,进而,能够提升搜索引擎的推荐准确度以及用户体验。

技术领域

本申请实施例涉及区块链的应用服务技术领域,并且更具体地,涉及搜索引擎中的个性化语义向量模型的训练方法及装置。

背景技术

截止目前,搜索引擎通常将用户输入的词句进行分词之后,再以倒排的方式在文档库中相似度得分靠前的文档作为推荐的文档,方便用户快速查找需要的文档。但是,利用分词的方式得到的推荐的文档和用户实际查找的文档有可能存在出入。例如,假设用户输入的词句为“道路机动车交通规则”,采用上述方式,会先将“道路机动车交通规则”拆分为“道路”,“机动车”以及“交通规则”,然后以倒排的方式在文档库中选择分别命中有这些词语的文档,例如,会优先推荐文档“机动车和在非机动车道路超速行驶算违反什么交通规则”、文档“交通规则中的机动车和非机动车”以及文档“机动车和电动自行车事故”等;然而通常情况下,用户是希望推荐具体的交通规则的相关文档,例如文档“交通道路行驶规则有哪些”或者文档“交通道路行驶规则是什么”等。可见,虽然实际推荐的文档和用户输入的词句是相关的,但跟用户实际需要的文档存在一定出入,降低了用户体验。

发明内容

本申请实施例提供了提供一种搜索引擎中的个性化语义向量模型的训练方法及装置,通过个性化语义向量模型,能够考虑用户输入的词句在语义上的相关性,进而,能够提升搜索引擎的推荐准确度以及用户体验。例如,假设用户输入的词句为“道路机动车交通规则”,利用个性化语义向量模型对分词后的特征进行语义上的关联,使得最终推荐的文档可以是文档“交通道路行驶规则有哪些”等。

一方面,本申请实施例提供了一种搜索引擎中的个性化语义向量模型的训练方法,包括:

获取第一查询特征和M个文档特征,M>0;

将该第一查询特征转换为第一查询向量,并将该M个文档特征分别转换为M个文档向量;

基于该第一查询向量和该M个文档向量,以预设的相似度差值作为训练目标,训练个性化语义向量模型;

其中,该相似度差值为正例向量和查询向量之间的相似度得分与负例向量和查询向量之间的相似度得分的差值,该正例向量为与查询特征形成正例的文档特征转换后的向量,该负例向量为与查询特征形成负例的文档特征转换后的向量。

另一方面,本申请实施例提供了一种搜索引擎中的个性化语义向量模型的训练装置,包括:

获取单元,用于获取第一查询特征和M个文档特征,M>0;

转换单元,用于将该第一查询特征转换为第一查询向量,并将该M个文档特征分别转换为M个文档向量;

训练单元,用于基于该第一查询向量和该M个文档向量,以预设的相似度差值作为训练目标,训练个性化语义向量模型;

其中,该相似度差值为正例向量和查询向量之间的相似度得分与负例向量和查询向量之间的相似度得分的差值,该正例向量为与查询特征形成正例的文档特征转换后的向量,该负例向量为与查询特征形成负例的文档特征转换后的向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110191195.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top