[发明专利]基于主题的匹配度确定方法、装置、电子设备及存储介质在审
申请号: | 202010319323.2 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111666371A | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 孙兴武;朱秋昱;张富峥;王仲远 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主题 匹配 确定 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种基于主题的匹配度确定方法、装置、电子设备及存储介质,所述方法包括:获取搜索文本,所述搜索文本包括至少一个搜索字;生成所述搜索字的第一向量和候选文本中每个候选字的第二向量;预测所述候选文本的主题分布;根据所述候选文本的主题分布和所述候选字的第二向量生成所述候选字的第三向量;根据所述搜索字的第一向量和所述候选字的第三向量确定所述搜索文本和所述候选文本的匹配度。本公开可以通过结合主题分布生成候选字的第三向量,使得计算的搜索文本和候选文本的匹配度结合了主题,有助于提高匹配度的准确度。
技术领域
本公开涉及搜索推荐技术领域,尤其涉及一种基于主题的匹配度确定方法、装置、电子设备及存储介质。
背景技术
在搜索推荐技术领域中,用户可以在客户端上输入搜索文本,以获取与该搜索文本匹配的候选文本。
现有技术中,一种搜索推荐方法主要包括:首先,接收搜索文本;然后,确定该搜索文本和候选文本集中每个候选文本的匹配度,其中,匹配度可以是搜索文本和候选文本包含的相同分词数目的占比,还可以是搜索文本的向量和候选文本的向量的相似度;最后,根据该匹配度将候选文本按照顺序推荐给用户。
发明人对上述方案进行研究之后,发现上述方案的匹配度的准确度较低。
发明内容
本公开提供一种基于主题的匹配度确定方法、装置、电子设备及存储介质,可以通过结合主题分布生成候选字的第三向量,使得计算的搜索文本和候选文本的匹配度结合了主题,有助于提高匹配度的准确度。
根据本公开的第一方面,提供了一种基于主题的匹配度确定方法,所述方法包括:
获取搜索文本,所述搜索文本包括至少一个搜索字;
生成所述搜索字的第一向量和候选文本中每个候选字的第二向量;
预测所述候选文本的主题分布;
根据所述候选文本的主题分布和所述候选字的第二向量生成所述候选字的第三向量;
根据所述搜索字的第一向量和所述候选字的第三向量确定所述搜索文本和所述候选文本的匹配度。
根据本公开的第二方面,提供了一种基于主题的匹配度确定装置,所述装置包括:
搜索文本获取模块,用于获取搜索文本,所述搜索文本包括至少一个搜索字;
向量生成模块,用于生成所述搜索字的第一向量和候选文本中每个候选字的第二向量;
主题分布预测模块,用于预测所述候选文本的主题分布;
向量更新模块,用于根据所述候选文本的主题分布和所述候选字的第二向量生成所述候选字的第三向量;
匹配度确定模块,用于根据所述搜索字的第一向量和所述候选字的第三向量确定所述搜索文本和所述候选文本的匹配度。
根据本公开的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述基于主题的匹配度确定方法。
根据本公开的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述基于主题的匹配度确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010319323.2/2.html,转载请声明来源钻瓜专利网。