[发明专利]基于语义相似度的关键词拓展方法和装置有效
申请号: | 201711229082.7 | 申请日: | 2017-11-29 |
公开(公告)号: | CN108182200B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 翁永金;李百川;陈第;蔡锐涛;李展铿 | 申请(专利权)人: | 有米科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 511400 广东省广州市番*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 相似 关键词 拓展 方法 装置 | ||
本发明涉及基于语义相似度的关键词拓展方法和装置。所述方法包括:接收待拓展关键词,计算待拓展关键词与预先确定的候选关键词集合中各个候选关键词的语义相似度;所述候选关键词集合中包含多个候选关键词;获取各个候选关键词在应用库平台中的搜索指数,根据所述语义相似度、预设的语义相似度权重以及各个候选关键词的搜索指数,计算各个候选关键词相对于所述待拓展关键词的相似度得分;按照相似度得分的高低顺序,从所述候选关键词集合中选取设定数量的候选关键词,得到所述待拓展关键词的拓展关键词。本发明能够自动筛选出相似性较高关键词,既实现量产,同时又可保证拓展质量。
技术领域
本发明涉及信息检索技术领域,特别是涉及基于语义相似度的关键词拓展方法和装置。
背景技术
随着智能终端的迅速发展,带动了移动互联网软件行业的发展。越来越多用户在智能终端中的应用库平台(即应用商店)下载各种APP(application,应用),根据维基百科数据显示,65%的用户通过应用商店搜索下载所需应用。所以APP开发者为提高自身APP在应用商店的搜索质量,需要做好应用商店的优化工作。其关键工作之一是做好APP关键词优化,而关键词的优化的核心内容是需要对APP的重点关键词进行拓展。
目前,基于智能终端应用商店的特定行业知识背景,关键词拓展较多依靠人工进行判断拓展,对于人工拓展,拓展质量受到人工主观认知水平的影响较大,存在关键词拓展结果的质量不稳定的缺陷。
发明内容
基于此,本发明提供了基于语义相似度的关键词拓展方法和装置,能够克服现有关键词拓展方式存在的质量不稳定的缺陷。
本发明实施例提供的方案包括:
一种基于语义相似度的关键词拓展方法,包括:
接收待拓展关键词,计算待拓展关键词与预先确定的候选关键词集合中各个候选关键词的语义相似度;所述候选关键词集合中包含多个候选关键词;
获取各个候选关键词在应用库平台中的搜索指数,根据所述语义相似度、预设的语义相似度权重以及各个候选关键词的搜索指数,计算各个候选关键词相对于所述待拓展关键词的相似度得分;
按照相似度得分的高低顺序,从所述候选关键词集合中选取设定数量的候选关键词,得到所述待拓展关键词的拓展关键词。
在一实施例中,接收待拓展关键词,计算待拓展关键词与预先确定的候选关键词集合中各个候选关键词的语义相似度之前,还包括:
获取应用库平台的历史搜索记录信息,根据所述历史搜索记录信息确定各关键词对应的第一映射关系;其中,所述历史搜索记录信息包括用于搜索的关键词信息以及各关键词的搜索结果信息;所述第一映射关系中包括关键词对应的候选APP集合,还包括候选APP集合中各个APP的出现频次信息;
根据所述历史搜索记录信息中多个关键词的所述第一映射关系,确定各APP对应的第二映射关系;所述第二映射关系中包括APP对应的关键词集合;
根据所述第一映射关系和第二映射关系得到所述应用库平台的候选关键词集合。
在一实施例中,根据所述历史搜索记录信息确定各关键词与覆盖APP的第一映射关系,包括:
根据所述历史搜索记录信息中同一个关键词在设定历史时段内的多次搜索结果,得到该关键词对应的多次搜索结果中的APP排序信息;
按照APP排序先后,从该关键词的每次搜索结果中选取设定数量的APP,得到所述关键词对应的候选APP集合;
统计候选APP集合中各个APP在所述多次搜索结果中的出现频次,得到所述关键词对应的特征向量;所述特征向量中的各个元素分别对应所述候选APP集合中各个APP的出现频次;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711229082.7/2.html,转载请声明来源钻瓜专利网。