[发明专利]联想词去重方法及装置、计算机可读存储介质和电子设备有效
申请号: | 202110368415.4 | 申请日: | 2021-04-06 |
公开(公告)号: | CN112765966B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 刘艾婷 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30;G06F16/9532 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联想 词去重 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本公开提供了一种联想词去重方法及装置、计算机可读存储介质和电子设备。该方法包括:获得不同候选联想词之间的语义关联特征表示向量;利用第一分类模型对不同候选联想词之间的语义关联特征表示向量进行处理,获得不同候选联想词之间的第一语义重复指标;获得不同候选联想词之间的历史搜索行为重叠特征表示向量,历史搜索行为重叠特征表示向量表示不同候选联想词之间的搜索行为重叠程度;利用第二分类模型对不同候选联想词之间的历史搜索行为重叠特征表示向量进行处理,获得不同候选联想词之间的第二语义重复指标;根据不同候选联想词之间的第一语义重复指标和第二语义重复指标,去重过滤候选联想词中存在语义重复的候选联想词,确定目标联想词。
技术领域
本公开涉及自然语言处理技术领域,具体而言,涉及一种联想词去重方法及装置、计算机可读存储介质和电子设备。
背景技术
随着互联网应用的发展,越来越多的用户通过在搜索页面输入关键词来触发搜索操作以实现搜索,或者在输入法的输入栏中输入关键词,在这些类似的应用场景中,为了提高用户体验,相关技术会通过各种技术手段感知用户的意图,根据用户输入的关键词罗列出相应的联想词,但相关技术无法有效地过滤这些联想词中存在语义重复的联想词,导致最终展示给用户的联想词不够丰富。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开实施例提供一种联想词去重方法及装置、计算机可读存储介质、电子设备,能够根据不同候选联想词之间的语义重复程度和搜索行为重叠程度,去除候选联想词中存在语义重复的候选联想词,从而可以展示更丰富的目标联想词。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提供一种联想词去重方法,所述方法包括:对查询关键词进行语义召回,获得所述查询关键词的候选联想词;获得不同候选联想词之间的语义关联特征表示向量,所述语义关联特征表示向量表示不同候选联想词之间的语义重复程度;利用第一分类模型对不同候选联想词之间的语义关联特征表示向量进行处理,获得不同候选联想词之间的第一语义重复指标;获得不同候选联想词之间的历史搜索行为重叠特征表示向量,所述历史搜索行为重叠特征表示向量表示不同候选联想词之间的搜索行为重叠程度;利用第二分类模型对不同候选联想词之间的历史搜索行为重叠特征表示向量进行处理,获得不同候选联想词之间的第二语义重复指标;根据不同候选联想词之间的第一语义重复指标和第二语义重复指标,去重过滤所述候选联想词中存在语义重复的候选联想词,确定目标联想词,以同时展示所述查询关键词和所述目标联想词。
本公开实施例提供一种联想词去重装置,所述装置包括:候选联想词获得单元,用于对查询关键词进行语义召回,获得所述查询关键词的候选联想词;语义关联特征向量获得单元,用于获得不同候选联想词之间的语义关联特征表示向量,所述语义关联特征表示向量表示不同候选联想词之间的语义重复程度;第一语义重复指标获得单元,用于利用第一分类模型对不同候选联想词之间的语义关联特征表示向量进行处理,获得不同候选联想词之间的第一语义重复指标;搜索行为重叠特征获得单元,用于获得不同候选联想词之间的历史搜索行为重叠特征表示向量,所述历史搜索行为重叠特征表示向量表示不同候选联想词之间的搜索行为重叠程度;第二语义重复指标获得单元,用于利用第二分类模型对不同候选联想词之间的历史搜索行为重叠特征表示向量进行处理,获得不同候选联想词之间的第二语义重复指标;候选联想词去重过滤单元,用于根据不同候选联想词之间的第一语义重复指标和第二语义重复指标,去重过滤所述候选联想词中存在语义重复的候选联想词,确定目标联想词,以同时展示所述查询关键词和所述目标联想词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110368415.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像识别模型的训练方法、装置及设备
- 下一篇:高浓度有机磷废水的预处理装置