[发明专利]连锁品牌词词库、类别词词库建立方法和装置有效
申请号: | 201310439450.6 | 申请日: | 2013-09-24 |
公开(公告)号: | CN104462143B | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 刘广权 | 申请(专利权)人: | 高德软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 102200 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连锁 品牌 词库 类别 建立 方法 装置 | ||
技术领域
本发明涉及地理信息技术领域,特别是连锁品牌词词库、类别词词库建立方法和装置。
背景技术
在利用导航引擎进行路径导航之前,通常需要先搜索目的地。在搜索目的地的过程中,用户先向导航引擎输入一个查询词,导航引擎从POI(Point of Interest,兴趣点)数据库中搜索与该查询词匹配的几个POI数据,当用户从中选择一个POI数据后,导航引擎根据用户选择的POI数据进行路径规划并导航。
在一些情况下,用户输入的查询词可能是反映某一种类别的类别词,例如,“餐馆”是一个类别词,基于不同的维度,“餐馆”既可以分为“中餐餐馆”和“西餐餐馆”,又可以分为“高档餐厅”和“街头小吃铺”,而“中餐餐馆”、“西餐餐馆”、“高档餐厅”和“街头小吃铺”作为“餐馆”的子类别,同样也都是类别词。在另一些情况下,用户输入的查询词也可能是反映某一个连锁品牌机构的连锁品牌词,例如,“工商银行”、“肯德基”和“苏宁电器”等都属于连锁品牌词。
目前,基于用户需求的考虑,为提高搜索结果的准确性,确保搜索结果更符合用户所需要查询的结果,当查询词是一个类别词或者是一个连锁品牌词时,导航引擎搜索与该查询词匹配的POI数据的搜索方法以及对搜索结果的排序方法与查询词为普通词(普通词不是类别词也不是连锁品牌词,如方恒国际中心)时,导航引擎所采用的搜索方法和排序方法不同。如当导航引擎判断出用户输入的查询词为类别词时,说明用户需要搜索的应该是某一种类别的POI,因此导航引擎采取的搜索方法是根据用户输入的类别词,从POI数据库中筛选出与该类别词匹配的POI,并在展示查询结果时按照POI距离用户位置由近到远的顺序展示;而当导航引擎判断出用户输入的查询词为连锁品牌词时,由于连锁品牌机构在地理上来说分布较为均匀,说明用户需要搜索的应该是距离当前位置较近的连锁品牌机构,因此导航引擎采取的搜索方法是搜索用户位置周边一定范围内的与连锁品牌词匹配的POI,并且在展示检索结果时,按照POI距离用户位置由近到远的顺序展示。
现有技术中,导航引擎判断用户输入的查询词为类别词或连锁品牌词的方式为:通过将查询词与类别词词库和连锁品牌词词库进行匹配,若从类别词词库中匹配到该查询词则判断该查询词为类别词,若从连锁品牌词词库中匹配到该查询词则判断该查询词为连锁品牌词词库。目前主要通过人工对POI数据进行分析、总结归纳出一些常用的类别词和连锁品牌词,并分别建立类别词词库和连锁品牌词词库,以便导航引擎依据类别词词库和连锁品牌词词库来识别一个查询词为类别词或连锁品牌词。但是,这种依靠人工的总结归纳来建立类别词词库和连锁品牌词词库的方式不仅工作效率低,而且,一旦出现了新的词汇,也无法及时更新词库。
发明内容
为了解决上述技术问题,本发明实施例提供了连锁品牌词、类别词词库建立方法和装置,能够从POI数据库中自动挖掘出连锁品牌词,以及从用户查询日志中自动挖掘出连锁品牌词和类别词,不仅提高了工作效率,而且,还可以通过定时挖掘,实现及时更新词库。
本发明实施例公开了如下技术方案:
一种连锁品牌词词库建立方法,包括:
将同一城市兴趣点POI数据库中名称主干相同的POI数据聚合成一个POI数据组,所述POI数据组与所述名称主干对应;
从各个POI数据组中提取所述POI数据组的识别特征;
从所有POI数据组中抽取出名称主干已被标记为连锁品牌词和非连锁品牌词的POI数据组作为训练数据,基于所述训练数据的识别特征进行连锁品牌词识别器的训练;
利用训练后的所述连锁品牌词识别器对所有POI数据组对应的名称主干中未识别的名称主干进行识别,识别出是连锁品牌词的名称主干;
将所述是连锁品牌词的名称主干存储在预置的连锁品牌词词库中。
一种连锁品牌词词库和类别词词库建立方法,包括:
从用户查询日志中,获取不同用户在同一城市通过相同的查询词查询得到的POI数据,将获取到的POI数据聚合成一个POI数据组,所述POI数据组与所述查询词对应;
从各个POI数据组中提取所述POI数据组的识别特征;
从所有POI数据组中抽取出查询词已被标记为连锁品牌词、类别词和普通词的POI数据组作为训练数据,基于所述训练数据的识别特征进行识别器的训练;
利用训练后的识别器对所有POI数据组对应的查询词中未识别的查询词进行识别,识别出是连锁品牌词和类别词的查询词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德软件有限公司,未经高德软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310439450.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种兴趣点父子关系的建立方法及装置
- 下一篇:网页数据采集方法及装置