[发明专利]一种基于百度地图API的地理位置实体规范化方法有效
| 申请号: | 201510623640.2 | 申请日: | 2015-09-28 |
| 公开(公告)号: | CN105335468B | 公开(公告)日: | 2019-09-13 |
| 发明(设计)人: | 吕学强;刘克会;董志安;李雪伟 | 申请(专利权)人: | 北京信息科技大学;北京市新技术应用研究所 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100192 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 百度 地图 api 地理位置 实体 规范化 方法 | ||
1.一种基于百度地图API的地理位置实体规范化方法,其特征在于,包括以下步骤:
步骤1):利用百度地图API,对缺陷地理位置实体进行检索,其中,所述缺陷地理位置实体是指地名区域缺失或者地名区域模糊的地理位置实体,记为defectLoc;
步骤2):利用步骤1)的检索结果,构建缺陷地理位置实体的区域特征向量;
步骤3):利用所述区域特征向量,对明确地理位置实体进行规范化;
其中,所述明确地理位置实体,是指检索结果中出现且只出现一个区域或者检索结果中每个区域概率的最大值Max(P(areai|defectLoc))≥γ的defectLoc,记为clearLoc,其中γ为clearLoc的参数;其中概率P(areai|defectLoc)的计算公式如式(1)所示:
areai代表defectLoc的检索结果中的一个区域;Score(areai|defectLoc)为defectLoc的检索结果中区域areai的分数;
步骤4):利用所述明确地理位置实体,对歧义地理位置实体进行规范化;
其中,所述歧义地理位置实体,是指检索结果中出现了多个区域且Max(P(areai|Location))<γ的defectLoc,记为ambiguityLoc;
步骤5):利用等价地理位置实体,对零地理位置实体进行规范化;
其中,所述等价地理位置实体,是指检索过程中,搜索输入框中输入的地理位置实体与检索结果中的地理位置实体等价,记为equalLoc;所述零地理位置实体,是指检索结果中未出现区域信息的defectLoc,记为zeroLoc;
Score(arean|defectLoc)为defectLoc的检索结果中每一个区域的分数,n为区域个数。
2.根据权利要求1所述的基于百度地图API的地理位置实体规范化方法,其特征在于,所述步骤1)具体为:
利用开放的Web服务API下面的Place API模块中的城市内检索功能,对地理位置实体进行检索,调用JavaScript API的Search方法以XML的数据格式接受地理位置实体的检索结果。
3.根据权利要求1所述的基于百度地图API的地理位置实体规范化方法,其特征在于,所述步骤2)具体为:
利用公式(2)计算检索结果中包含的区域的个数:
其中bag={address1,address2,...,addressj},目标区域为Area={area1,area2,...,arean},其中j为搜索引擎返回的检索结果的个数,n为区域个数;address代表地理位置的具体地址信息;bag代表j个地理位置的具体地址信息的集合;
利用公式(3)计算检索结果中各个区域的权重:
利用公式(4)构建缺陷地理位置实体的区域特征向量(Score(area1|defectLoc),Score(area2|defectLoc),...,Score(arean|defectLoc)):
其中defectLoc为缺陷地理位置实体。
4.根据权利要求1所述的基于百度地图API的地理位置实体规范化方法,其特征在于,在所述步骤3)中,如果检索结果中只含有一个区域,则此区域信息为缺陷地理位置实体的区域信息。
5.根据权利要求1所述的基于百度地图API的地理位置实体规范化方法,其特征在于,所述步骤4)具体为:
通过提取地理位置实体组中的clearLoc对所述歧义地理位置实体进行消歧;
其中,所述地理位置实体组是指如果在同一个投诉文本中出现了多个地理位置实体,则将这些地理位置实体进行组合,构成一个地理位置实体组,记为:LocationSet,LocationSet={Location1,Location2,...,Locationn},LocationSet中的Location1、Location2、...,Locationn分别代表一个地理位置实体,n为正整数,n的值等于地理位置实体组中所包含的地理位置实体的总个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学;北京市新技术应用研究所,未经北京信息科技大学;北京市新技术应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510623640.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种互联网网站责任主体识别方法
- 下一篇:基于日历视图的文件管理系统及方法





