[发明专利]基于语义相似度的关键词拓展方法和装置有效

专利信息
申请号: 201711229082.7 申请日: 2017-11-29
公开(公告)号: CN108182200B 公开(公告)日: 2020-10-23
发明(设计)人: 翁永金;李百川;陈第;蔡锐涛;李展铿 申请(专利权)人: 有米科技股份有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F40/30
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 冯右明
地址: 511400 广东省广州市番*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 相似 关键词 拓展 方法 装置
【权利要求书】:

1.一种基于语义相似度的关键词拓展方法,其特征在于,包括:

接收待拓展关键词,计算待拓展关键词与预先确定的候选关键词集合中各个候选关键词的语义相似度;所述候选关键词集合中包含多个候选关键词;所述预先确定的候选关键词集合基于应用库平台的历史搜索记录信息得到;

获取各个候选关键词在应用库平台中的搜索指数;根据所述语义相似度、预设的语义相似度权重以及各个候选关键词的搜索指数,计算各个候选关键词相对于所述待拓展关键词的相似度得分;所述搜索指数根据设定统计时间内采用该关键词在应用库平台进行APP搜索的累计次数计算得到;

按照相似度得分的高低顺序,从所述候选关键词集合中选取设定数量的候选关键词,得到所述待拓展关键词的拓展关键词。

2.根据权利要求1所述的基于语义相似度的关键词拓展方法,其特征在于,接收待拓展关键词,计算待拓展关键词与预先确定的候选关键词集合中各个候选关键词的语义相似度之前,还包括:

获取应用库平台的历史搜索记录信息,根据所述历史搜索记录信息确定各关键词对应的第一映射关系;其中,所述历史搜索记录信息包括用于搜索的关键词信息以及各关键词的搜索结果信息;所述第一映射关系中包括关键词对应的候选APP集合,还包括候选APP集合中各个APP的出现频次信息;

根据所述历史搜索记录信息中多个关键词的所述第一映射关系,确定各APP对应的第二映射关系;所述第二映射关系中包括APP对应的关键词集合;

根据所述第一映射关系和第二映射关系得到所述应用库平台的候选关键词集合。

3.根据权利要求2所述的基于语义相似度的关键词拓展方法,其特征在于,根据所述历史搜索记录信息确定各关键词对应的第一映射关系,包括:

根据所述历史搜索记录信息中同一个关键词在设定历史时段内的多次搜索结果,得到该关键词对应的多次搜索结果中的APP排序信息;

按照APP排序先后,从该关键词的每次搜索结果中选取设定数量的APP,得到所述关键词对应的候选APP集合;

统计候选APP集合中各个APP在所述多次搜索结果中的出现频次,得到所述关键词对应的特征向量;所述特征向量中的各个元素分别对应所述候选APP集合中各个APP的出现频次;

根据所述关键词对应的候选APP集合以及特征向量,得到该关键词对应的第一映射关系。

4.根据权利要求3所述的基于语义相似度的关键词拓展方法,其特征在于,根据所述第一映射关系和第二映射关系得到所述应用库平台的候选关键词集合,包括:

根据所述第一映射关系和第二映射关系得到一关键词矩阵,所述关键词矩阵的行数等于第一映射关系中关键词对应的候选APP集合中的APP个数,所述关键词矩阵的列数等于第二映射关系中APP对应的关键词集合中的关键词个数;

根据所述关键词矩阵中各个关键词的出现频次,从所述关键词矩阵中选取出现频次大于或等于设定频次的关键词,得到中间关键词集合;

获取所述中间关键词集合中各关键词的搜索指数,从所述中间关键词集合中选取搜索指数大于或等于设定搜索指数值的关键词,得到候选关键词集合。

5.根据权利要求3或4所述的基于语义相似度的关键词拓展方法,其特征在于,通过如下公式计算所述待拓展关键词与候选关键词集合中各个候选关键词的语义相似度:

其中,ki、kj分别表示第i个关键词和第j个关键词,V(ki)、V(kj)分别表示第i个关键词对应的特征向量、第j个关键词对应的特征向量,V(ki)·V(kj)表示两个向量的内积,||V(ki)||2表示向量V(ki)的2-范数,||V(ki)||2||V(kj)||2表示特征向量V(ki)的2-范数与V(kj)的2-范数的乘积,sim(ki,kj)表示第i个关键词和第j个关键词的语义相似度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711229082.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top