[发明专利]一种基于百度地图API的地理位置实体规范化方法有效
| 申请号: | 201510623640.2 | 申请日: | 2015-09-28 |
| 公开(公告)号: | CN105335468B | 公开(公告)日: | 2019-09-13 |
| 发明(设计)人: | 吕学强;刘克会;董志安;李雪伟 | 申请(专利权)人: | 北京信息科技大学;北京市新技术应用研究所 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100192 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 百度 地图 api 地理位置 实体 规范化 方法 | ||
本发明涉及一种基于百度地图API的地理位置实体规范化方法,包括以下步骤:步骤1):利用百度地图API,对缺陷地理位置实体进行检索;步骤2):利用步骤1)的检索结果,构建缺陷地理位置实体的区域特征向量;步骤3):利用所述区域特征向量,对明确地理位置实体进行规范化;步骤4):利用所述明确地理位置实体,对歧义地理位置实体进行规范化;步骤5):利用等价地理位置实体,对零地理位置实体进行规范化。本发明以城市管理投诉文本为基础,利用地图API实现地理位置实体的规范化,结合城市管理投诉文本的特点、地理位置实体中存在的问题,对不完整的地理位置实体进行区域补全,从而解决了统计分析工作难以进行的局面。
技术领域
本发明属于中文信息处理技术领域,具体涉及一种基于百度地图API的地理位置实体规范化方法。
背景技术
随着数字化城市的发展,城市管理进入信息化时代,百姓通过数字化平台反映城市管理中存在的问题。由于他们年龄、学历、表达方式存在差异,导致城市管理投诉语料存在格式不规范,表达不统一等特点,工作人员只能逐字浏览,才能发现其中的重要信息,工作繁琐且效率低下。
由于城市管理投诉语料来自于群众,格式不规范,表达不统一,其中的地理位置实体结构复杂,长度较长,如表1所示。从表中可以看出,地理位置实体存在如下现象:第一,地名区域缺失,如:“南礼士路地铁口南”缺失区域名称;第二,地名区域模糊,如:“长安街”,无法判断“长安街”这个地理位置是位于西城区还是东城区。
表1:城市管理投诉文本中地理位置实体示例
序号 地理位置实体示例 1 南礼士路地铁口南 2 朝阳区劲松二区229号楼都城心屿小区西侧停车场 3 北京邮电大学南门对面胡同 4 海淀区车道沟桥,牛顿办公区和嘉豪国际中心的停车场 5 马家堡西路角门西地铁站外面的丁字路口,南北向人行横道上北面 6 西城区百万庄南街3号3楼最东面 7 长安街
存在上述两种情况的地理位置实体称为缺陷地理位置实体,记为defectLoc。由于defectLoc的存在,对工作人员的统计分析工作带来了极大的困难,以致于工作人员很难统计各个区域的事故发生量而不能及时预防事故的发生。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学;北京市新技术应用研究所,未经北京信息科技大学;北京市新技术应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510623640.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种互联网网站责任主体识别方法
- 下一篇:基于日历视图的文件管理系统及方法





