[发明专利]POI文本的检索方法、装置及电子设备在审
申请号: | 201910906460.3 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110765262A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 沈奇;陈欢 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/338 | 分类号: | G06F16/338;G06F16/9535 |
代理公司: | 11646 北京超成律师事务所 | 代理人: | 吴迪 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拼音查询 分词 分词处理 文本 片段组 数据库 检索词 匹配度 预设 检索 装置及电子设备 检索准确率 滑动窗口 检索结果 信息对应 字节流 拼音 匹配 申请 应用 | ||
1.一种POI文本的检索方法,其特征在于,包括:
获取用户的拼音查询信息;
对所述拼音查询信息进行顺序分词处理,得到包括至少一个分词片段的分词片段组;所述顺序分词处理为以预设值为窗口大小,按所述拼音查询信息的字节流进行的滑动窗口操作;
以所述分词片段组中的分词片段分别作为检索词,应用所述检索词对当前POI数据库中的POI文本进行检索,得到每个POI文本与所述分词片段组的匹配度;所述POI数据库中的每个POI文本均包括通过所述顺序分词处理得到的POI拼音片段;
将匹配度达到预设匹配阈值的POI文本确定为所述拼音查询信息对应的检索结果。
2.根据权利要求1所述的方法,其特征在于,对所述拼音查询信息进行顺序分词处理,得到包括至少一个分词片段的分词片段组的步骤,包括:
以预设值为窗口大小,按所述拼音查询信息的字节流进行滑动窗口操作,得到按所述字节流顺序排列的至少一个分词片段;
将按所述字节流顺序排列的至少一个分词片段作为所述拼音查询信息对应的分词片段组。
3.根据权利要求1所述的方法,其特征在于,在获取用户的拼音查询信息的步骤之前,还包括:
获取所述POI数据库中的各个POI文本对应的拼音字段;
针对每个所述POI文本对应的拼音字段,均执行以下步骤:
对所述POI文本对应的拼音字段进行所述顺序分词处理,得到所述POI文本对应的至少一个分词片段;将所述POI文本对应的至少一个分词片段作为所述POI文本对应的POI拼音片段,将所述POI拼音片段存储于所述POI数据库中。
4.根据权利要求1所述的方法,其特征在于,以所述分词片段组中的分词片段分别作为检索词,应用所述检索词对当前POI数据库中的POI文本进行检索,得到每个POI文本与所述分词片段组的匹配度的步骤,包括:
针对当前POI数据库中的每个POI文本,均执行以下步骤:
应用所述分词片段组中的每个分词片段分别作为检索词,逐一在所述POI文本对应的POI拼音片段中进行检索,确定所述分词片段组中的分词片段在所述POI文本中被检索到的分词片段数量;利用所述被检索到的分词片段数量,除以所述分词片段组中分词片段的总个数,得到所述POI文本与所述分词片段组的匹配度。
5.根据权利要求1所述的方法,其特征在于,以所述分词片段组中的分词片段分别作为检索词,应用所述检索词对当前POI数据库中的POI文本进行检索,得到每个POI文本与所述分词片段组的匹配度的步骤,包括:
针对所述分词片段组中的每个分词片段,均执行以下步骤:以所述分词片段为检索词,逐一在每个所述POI文本对应的POI拼音片段中进行检索,根据当前检索结果更新每个所述POI文本的匹配度;
当所述分词片段组中的每个分词片段均完成检索,将每个所述POI文本的最后一个匹配度作为该POI文本与所述分词片段组的匹配度。
6.根据权利要求1所述的方法,其特征在于,在将匹配度达到预设匹配阈值的POI文本确定为所述拼音查询信息对应的检索结果的步骤之后,还包括:
以POI文本的热度从大到小为顺序,对所述检索结果中的POI文本进行排序;
展示排序后的检索结果。
7.根据权利要求1所述的方法,其特征在于,所述拼音查询信息为地理位置查询信息;
在获取用户的拼音查询信息的步骤之前,还包括:
接收用户输入的区域名称;
将所述区域名称对应的POI数据库作为当前POI数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910906460.3/1.html,转载请声明来源钻瓜专利网。