[发明专利]搜索引擎中的个性化语义向量模型的训练方法及装置有效
| 申请号: | 202110191195.2 | 申请日: | 2021-02-19 |
| 公开(公告)号: | CN113010771B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 陈咨尧;陈强;梁龙军 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06F16/951;G06F40/151;G06F40/194;G06F40/30;G06F18/214 |
| 代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索引擎 中的 个性化 语义 向量 模型 训练 方法 装置 | ||
本申请实施例提供了提供一种搜索引擎中的个性化语义向量模型的训练方法及装置,涉及区块链的应用服务技术领域,该训练方法包括:获取第一查询特征和M个文档特征,M>0;将该第一查询特征转换为第一查询向量,并将该M个文档特征分别转换为M个文档向量;基于该第一查询向量和该M个文档向量,以预设的相似度差值作为训练目标,训练个性化语义向量模型。本申请提供的训练方法,通过个性化语义向量模型,能够考虑用户输入的词句在语义上的相关性,进而,能够提升搜索引擎的推荐准确度以及用户体验。
技术领域
本申请实施例涉及区块链的应用服务技术领域,并且更具体地,涉及搜索引擎中的个性化语义向量模型的训练方法及装置。
背景技术
截止目前,搜索引擎通常将用户输入的词句进行分词之后,再以倒排的方式在文档库中相似度得分靠前的文档作为推荐的文档,方便用户快速查找需要的文档。但是,利用分词的方式得到的推荐的文档和用户实际查找的文档有可能存在出入。例如,假设用户输入的词句为“道路机动车交通规则”,采用上述方式,会先将“道路机动车交通规则”拆分为“道路”,“机动车”以及“交通规则”,然后以倒排的方式在文档库中选择分别命中有这些词语的文档,例如,会优先推荐文档“机动车和在非机动车道路超速行驶算违反什么交通规则”、文档“交通规则中的机动车和非机动车”以及文档“机动车和电动自行车事故”等;然而通常情况下,用户是希望推荐具体的交通规则的相关文档,例如文档“交通道路行驶规则有哪些”或者文档“交通道路行驶规则是什么”等。可见,虽然实际推荐的文档和用户输入的词句是相关的,但跟用户实际需要的文档存在一定出入,降低了用户体验。
发明内容
本申请实施例提供了提供一种搜索引擎中的个性化语义向量模型的训练方法及装置,通过个性化语义向量模型,能够考虑用户输入的词句在语义上的相关性,进而,能够提升搜索引擎的推荐准确度以及用户体验。例如,假设用户输入的词句为“道路机动车交通规则”,利用个性化语义向量模型对分词后的特征进行语义上的关联,使得最终推荐的文档可以是文档“交通道路行驶规则有哪些”等。
一方面,本申请实施例提供了一种搜索引擎中的个性化语义向量模型的训练方法,包括:
获取第一查询特征和M个文档特征,M>0;
将该第一查询特征转换为第一查询向量,并将该M个文档特征分别转换为M个文档向量;
基于该第一查询向量和该M个文档向量,以预设的相似度差值作为训练目标,训练个性化语义向量模型;
其中,该相似度差值为正例向量和查询向量之间的相似度得分与负例向量和查询向量之间的相似度得分的差值,该正例向量为与查询特征形成正例的文档特征转换后的向量,该负例向量为与查询特征形成负例的文档特征转换后的向量。
另一方面,本申请实施例提供了一种搜索引擎中的个性化语义向量模型的训练装置,包括:
获取单元,用于获取第一查询特征和M个文档特征,M>0;
转换单元,用于将该第一查询特征转换为第一查询向量,并将该M个文档特征分别转换为M个文档向量;
训练单元,用于基于该第一查询向量和该M个文档向量,以预设的相似度差值作为训练目标,训练个性化语义向量模型;
其中,该相似度差值为正例向量和查询向量之间的相似度得分与负例向量和查询向量之间的相似度得分的差值,该正例向量为与查询特征形成正例的文档特征转换后的向量,该负例向量为与查询特征形成负例的文档特征转换后的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110191195.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于熔喷布生产的传送吸杂装置
- 下一篇:一种5G通信基站塔体安装方法





