[发明专利]一种车载导航设备关键词库建立方法及装置有效
申请号: | 201310542335.1 | 申请日: | 2013-11-05 |
公开(公告)号: | CN104615603B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 崔玮 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;安利霞 |
地址: | 100028 北京市朝阳区曙光西里甲*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载导航设备 关键词库 属性信息 关键词类别 关键词检索 单位类别 通用词 行政区划 行政区 拼音 制作 | ||
1.一种车载导航设备关键词库建立方法,其特征在于,包括:
获取关键词;
基于获取的关键词,制作所述关键词的属性信息,所述属性信息包括名称、拼音、关键词类别、关键词优先级以及行政区划号,所述关键词优先级中,分别属于字号、单位类别、道路名、行政区域名、通用词类别的关键词的优先级依次降低;
基于所述关键词的属性信息建立关键词库;
所述获取关键词的过程包括:
对获取的设施名称进行关键词筛选,其中,当待分词的设施名称中的设施类别与关键词属性信息中的关键词类别符合预先建立的关联关系,将所述设施名称中的字号划分为关键词。
2.如权利要求1所述的方法,其特征在于,所述获取关键词的过程还包括:
从已有词库中获取关键词。
3.如权利要求2所述的方法,其特征在于,所述对获取的设施名称进行关键词筛选的过程包括:
对获取的设施名称进行词汇划分;
判断划分后的词汇是否已经存在于已有词库中;
对于没有存在于已有词库中的词汇,进行关键词判断。
4.如权利要求3所述的方法,其特征在于,所述对获取的设施名称进行词汇划分的过程包括:
对于划分后包含一个字的第一词汇,将所述第一词汇与在所述第一词汇之前划分出来的第二词汇组合成第三词汇,以及将所述第一词汇与在所述第一词汇之后划分出来的第四词汇组合成第五次词汇;和/或,
对于划分后名称相同的词汇,合并记录为一个词汇。
5.如权利要求3或4所述的方法,其特征在于,所述对获取的设施名称进行词汇划分的过程还包括:
统计每一个词汇出现的次数,以及每一个词汇在不同设施类别中出现的次数。
6.如权利要求3所述的方法,其特征在于,所述进行关键词判断的过程包括:
将语义明确且无法再次划分的词汇,确定为对应的单位类别类或通用词类关键词;
将语义明确且能够再次划分的词汇,进行再次划分,并将再次划分后的词汇确定为对应的单位类别类或通用词类关键词;
将语义不明确但属于字号类或地名类的词汇,确定为字号类或地名类关键词;
将语义不明确且不属于字号类或地名类的词汇,确定为非关键词。
7.如权利要求1所述的方法,其特征在于,所述方法还包括关键词库更新过程;
所述关键词库更新过程包括:
确定需要更新至所述关键词库的第一关键词的属性信息;
基于所述第一关键词的属性信息,与所述关键词库中已经存在的第二关键词的属性信息之间的差别,进行关键词库的更新。
8.如权利要求7所述的方法,其特征在于,所述基于得到第一关键词的属性信息,与所述关键词库中已经存在的第二关键词的属性信息之间的差别,进行关键词库的更新的过程包括:
若所述关键词库中已经存在与所述第一关键词的属性信息一致的第二关键词时,无需进行关键词库的更新过程;
若所述关键词库中已经存在的与所述第一关键词名称相同但关键词优先级不同的第二关键词时,保留关键词优先级低的关键词,删除关键词优先级高的关键词;
若所述关键词库中已经存在与所述第一关键词名称相同但关键词类别不同的第二关键词时,将所述第一关键词的关键词类别增加至所述第二关键词的属性信息中;
若所述关键词库中不存在与所述第一关键词属性信息相同的第二关键词,则将所述第二关键词添加至所述关键词库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310542335.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种联系人管理方法及装置
- 下一篇:一种大数据服务器