[发明专利]短文本的推荐方法、装置、介质及电子设备在审
申请号: | 201911006125.4 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110737839A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 郑宇宇 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/30;G06N3/04 |
代理公司: | 11205 北京同立钧成知识产权代理有限公司 | 代理人: | 杨俊辉;刘芳 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 短文本 语义向量 排序 相似度 电子设备 方式获取 实际需求 特征向量 推荐内容 语义层面 语义 点击率 贴合 | ||
本发明提供一种短文本的推荐方法、装置、介质及电子设备,该方法包括:根据用户输入的第一短文本,采用ES方式获取多个第二短文本,获取第一短文本的语义向量以及每个第二短文本的语义向量,并计算每个第二短文本的语义向量与第一短文本的语义向量之间的相似度,其中,短本文的语义向量用于表示短文本语义的特征向量,最后根据每个第二短文本的语义向量与第一短文本的语义向量之间的相似度大小,对多个第二短文本进行排序,并推荐排序后的第二短文本。本方案通过从短文本的深层语义层面进行短文本召回和排序,能够更贴合用户的实际需求,有效提高推荐内容的点击率。
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种短文本的推荐方法、装置、介质及电子设备。
背景技术
随着大数据时代的来临,如何帮助用户从大量信息中迅速获得对自己有用的信息成为众多商家的重要任务,个性化推荐系统应运而生。个性化推荐系统以海量数据挖掘为基础,引导用户发现自己的信息需求,现已广泛应用于很多领域,尤其是短文本搜索推荐应用最为广泛。
目前,对于在线实时短文本文本推荐方面,现有技术主要有两类技术,一类是利用分布式全文搜索(ElasticSearch,ES)检索召回指定数量的短文本,作为为用户推荐的文本;另一类是利用ES检索召回指定数量的短文本,然后利用关键字权重对召回的短文进行排序,排序之后作为为用户推荐的文本。
然而,上述方案中,通过ES检索召回的短文本,直接显示或者按照关键字进行排序推荐,用户能较早查看的短文本可能不是最贴近用户实际需求的内容,导致点击率不高的问题。
发明内容
本发明实施例提供一种短文本的推荐方法、装置、介质及电子设备,以解决现有技术中召回的短文本直接显示或者按照关键字进行排序推荐,用户能较早查看的短文本可能不是最贴近用户实际需求的内容,导致点击率不高的问题。
第一方面,本发明实施例提供一种短文本的推荐方法,所述方法包括:
根据用户输入的第一短文本,采用ES方式获取多个第二短文本;
获取所述第一短文本的语义向量以及每个第二短文本的语义向量,并计算每个第二短文本的语义向量与所述第一短文本的语义向量之间的相似度;其中,短本文的语义向量用于表示所述短文本语义的特征向量;
根据每个第二短文本的语义向量与所述第一短文本的语义向量之间的相似度大小,对所述多个第二短文本进行排序,并推荐排序后的第二短文本。
在一种具体实施方式中,所述获取所述第一短文本的语义向量以及每个第二短文本的语义向量,包括:
根据BERT模型以及卷积神经网络CNN模型分别对所述第一短文本进行处理,并对得到的结果进行全连接处理,得到所述第一短文本的语义向量;
从预设的数据库中,根据短文本和语义向量之间的对应关系,获取每个第二短文本的语义向量;其中,所述数据库中存储有多个待搜索短文本的语义向量。
在另一种具体实施方式中,所述方法还包括:
根据BERT模型以及CNN模型分别对待搜索的每个短文本进行处理,并对得到的结果进行全连接处理,得到每个待搜索短文本的语义向量;
将每个待搜索短文本的语义向量存储在所述数据库中,并建立短文本和语义向量之间的对应关系。
在一种具体实施方式中,根据用户输入的第一短文本,采用分布式搜索ES方式获取多个第二短文本,包括:
对所述第一短文本进行分词处理,得到分词结果;
根据所述分词结果在ES搜索服务器中进行匹配检索,根据文本相似度由高到低的顺序,获取所述多个第二短文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911006125.4/2.html,转载请声明来源钻瓜专利网。