[发明专利]搜索相关词的方法及装置、存储介质和终端设备有效
申请号: | 201710425702.8 | 申请日: | 2017-06-07 |
公开(公告)号: | CN107368525B | 公开(公告)日: | 2020-03-03 |
发明(设计)人: | 李贤 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 相关 方法 装置 存储 介质 终端设备 | ||
本发明公开了一种搜索相关词的方法、装置、存储介质及终端设备,所述方法包括:接收键入的关键词,从词条数据库中获取所述关键词的第一相关词集;所述第一相关词集中的相关词包括所述关键词;将所述第一相关词集中的每一个相关词的第二相关词集的并集作为第三相关词集;对所述第一相关词集中的每一个相关词,根据所述第三相关词集中的每一个词在所述相关词的第二相关词集中记载的词频,构建所述相关词的向量;根据所述第一相关词集中的每一个相关词的向量,获取所述关键词与所述第一相关词集中的每一个相关词的相似度,并选取所述关键词的相关词。采用本发明实施例,能够同时提高搜索相关词的准确度和搜索效率。
技术领域
本发明涉及计算机搜索技术领域,尤其涉及一种搜索相关词的方法及装置、存储介质和终端设备。
背景技术
目前,购物网站以及搜索引擎服务网站都提供的关键词搜索的功能,即用户输入想要搜索的商品或技术的关键词,服务器则根据该关键词搜索出相应的结果并返回给用户。服务器为了提供准确的搜索结果,服务器一般会对关键词进行扩展,即根据用户输入的关键词,查找出关键词对应的相关词,并提供查找到的相关词给用户,在用户通过关键词搜索而未能得到满意的搜索结果时,就根据相关词进行搜索。但现有的相关词扩展是通过已有词典进行扩展,例如WordNet、《同义词林》,而这种方式所获得的相关词在数量上相当有限,而且所获得的相关词有可能跟不上语言的发展变化,不能满足相关词对时效性的要求。以及,即使通过扩展使得获取到的相关词更多,但是获取的过程效率低下。
发明内容
本发明实施例的目的是提出的一种搜索相关词的方法及装置、存储介质和终端设备,能够同时提高搜索相关词的准确度和搜索效率。
为实现上述目的,本发明实施例提供一种搜索相关词的方法,包括:
接收键入的关键词,从词条数据库中获取所述关键词的第一相关词集;所述第一相关词集中的相关词包括所述关键词;
将所述第一相关词集中的每一个相关词的第二相关词集的并集作为第三相关词集;其中,所述每一个相关词的第二相关词集是从所述词条数据库中获取的;
对所述第一相关词集中的每一个相关词,根据所述第三相关词集中的每一个词在所述相关词的第二相关词集中记载的词频,构建所述相关词的向量;
根据所述第一相关词集中的每一个相关词的向量,获取所述关键词与所述第一相关词集中的与所述关键词不相同的每一个相关词的相似度,并根据所获取到的相似度选取所述关键词的相关词。
进一步地,所述第一相关词集中的第i个相关词为bi,则所述第i个相关词bi的向量为其中,m为所述第三相关词集的词的个数,cx为所述第三相关词集中的第x个词;为所述第三相关词集中的第x个词cx在所述第i个相关词bi的第二相关词集中记载的词频。
作为本发明技术方案改进的一个方面,所述关键词为a,则所述关键词a与所述第一相关词集中的第i个相关词为bi的相似度为:
其中,为所述第三相关词集中的第x个词cx在以所述关键词a为相关词的第二相关词集中记载的词频。
作为本发明技术方案改进的另一个方面,所述关键词为a,则所述关键词a与所述第一相关词集中的第i个相关词为bi的相似度为:
其中,为所述第三相关词集中的第x个词cx在以所述关键词a为相关词的第二相关词集中记载的词频
作为本发明技术方案改进的又一个方面,所述关键词为a,则所述关键词a与所述第一相关词集中的第i个相关词为bi的相似度为:
其中,为所述关键词a的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710425702.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对话生成方法、装置以及电子设备
- 下一篇:一种数据处理方法及装置