[发明专利]一种词表检索方法、装置、电子设备及存储介质在审
申请号: | 202010624239.1 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111797205A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 连义江 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/284 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 词表 检索 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种词表检索方法、装置、电子设备及存储介质,涉及智能搜索技术领域及自然语言处理技术领域。具体方案为:接收用户提交的检索词;在预先设置的词表的关键字中匹配检索词;响应于在词表的关键字中未匹配到检索词,根据检索词计算得到与其对应的规约检索词;在词表的关键字中搜索规约检索词;响应于在词表的关键字中搜索到规约检索词,根据搜索到的关键字得到规约检索词对应的值,根据规约检索词对应的值确定检索词对应的检索结果。本申请实施例能够极大地提升词表的命中率,同时还可以节省词表的存储空间。
技术领域
本申请涉及计算机技术领域,进一步涉及智能搜索技术领域及自然语言处理技术领域,尤其是一种词表检索方法、装置、电子设备及存储介质。
背景技术
商业搜索(Sponsored Search)中有三种角色:用户、广告主和商业搜索引擎。用户在进行商业搜索时,先提交检索词,即检索词,然后广告主向商业搜索引擎提供关键词和广告创意,商业搜索引擎设计了检索词和关键词的匹配方式和广告的拍卖机制,当用户提交的检索词和广告主提交的关键词匹配时,广告主的广告创意会展示在用户的搜索结果页面中来。
大型的商业搜索引擎(例如,百度搜索引擎)每天都会有数十亿的检索词需要做在线处理,其中每一个检索词需要和数十亿的关键词之间计算匹配关系,这无疑给商业搜索引擎服务带来了很大的挑战。
在现有的词表检索方法中,一般情况下,词表的命中方法是要求字符串完全相等,这样则会导致检索词的覆盖面非常有限,关键词的召回能力较差。
发明内容
本申请提供了一种词表检索方法、装置、设备以及存储介质,能够极大地提升词表的命中率,同时还可以节省词表的存储空间。
第一方面,本申请提供了一种词表检索方法,所述方法包括:
接收用户提交的检索词;
在预先设置的词表的关键字中匹配所述检索词;响应于在所述词表的关键字中未匹配到所述检索词,根据所述检索词计算得到与其对应的规约检索词;
在所述词表的关键字中搜索所述规约检索词;响应于在所述词表的关键字中搜索到所述规约检索词,根据搜索到的关键字得到所述规约检索词对应的值,根据所述规约检索词对应的值确定所述检索词对应的检索结果。
第二方面,本申请提供了一种词表检索装置,所述装置包括:接收模块、匹配模块、计算模块和搜索模块;其中,
所述接收模块,用于接收用户提交的检索词;
所述匹配模块,用于在预先设置的词表的关键字中匹配所述检索词;
所述计算模块,用于响应于在所述词表的关键字中未匹配到所述检索词,根据所述检索词计算得到与其对应的规约检索词;
所述搜索模块,用于在所述词表的关键字中搜索所述规约检索词;响应于在所述词表的关键字中搜索到所述规约检索词,根据搜索到的关键字得到所述规约检索词对应的值,根据所述规约检索词对应的值确定所述检索词对应的检索结果。
第三方面,本申请实施例提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的词表检索方法。
第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的词表检索方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010624239.1/2.html,转载请声明来源钻瓜专利网。