[发明专利]基于SVM分类模型的街道级地标获取方法有效
| 申请号: | 201910128483.6 | 申请日: | 2019-02-20 |
| 公开(公告)号: | CN110311991B | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 罗向阳;李瑞祥;孙雨宸;马伟特;杨春芳;尹美娟 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
| 主分类号: | H04L61/4511 | 分类号: | H04L61/4511;G06K9/62;H04L101/69 |
| 代理公司: | 郑州联科专利事务所(普通合伙) 41104 | 代理人: | 刘建芳 |
| 地址: | 450001 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 svm 分类 模型 街道 地标 获取 方法 | ||
本发明提供了基于SVM分类模型的街道级地标获取方法,针对当前已有地标获取方法无法快速获取大量街道级地标的不足,提出利用开放端口识别该IP上所承载的服务,并对IP进行域名反解析,同时构建地区机构信息库,并基于该机构信息库使用社会工程学手段,结合数据库查询和在线地图的方法得到候选街道级地标,最后使用街道级地标评估方法对获得的候选街道级地标进行评估得到可靠街道级地标;本发明所述的基于SVM分类模型的街道地标获取方法能够在更短的时间内获得更多的街道级可靠地标。
技术领域
本发明涉及街道地标获取领域,尤其涉及基于SVM分类模型的街道地标获取方法。
背景技术
高精度的IP定位在追踪网络攻击对象、定位隐蔽通信主体和减少P2P下载时间等方面具有很高的应用前景。街道级IP定位对街道级地标(IP和地理地址已知的网络实体)提出了高密度的要求。如何获取丰富的街道级地标,是街道级IP定位中亟需解决的问题。当前,获取地标的主要方法有数据库查询,以及基于Web的地标挖掘方法。
基于IP位置数据库查询的地标获取方法使用数据库API接口,从已有IP位置数据库中获取地标。当前,多数IP位置数据库(如Baidu、IPIP、IP.cn等)提供免费API接口,部分商业公司(如MaxMind等)提供收费的API接口。使用数据库API接口能够在短时间内获得大量地标。但由于这些数据库提供的地标精度仅到城市级别,且数据库总的可靠性不高。因此,使用该方法难以获得大量可靠的街道级地标。
Guo C等人提出的Structon方法是一种基于Web挖掘的地标获取方法。使用Microsoft Research Asia的Web搜索和挖掘小组抓取的74M个中文网页,在过滤URL中包含“blog”,“bbs”,“forum”的页面后,使用正则表达式从网页中提取位置信息(地址、区域代码和邮政编码)。若从一个页面中提取出多个位置,则仅选择出现在网页中的最后一个地址;若地址、区域代码和邮政编码所属区域不一致,则根据同IP段中的其他IP的位置分别计算每个可能位置的位置权值,最大权值位置为IP的位置。该方法获在获取地标时从每个Web页面中提取位置信息,需要大量的Web页面源,且地标获取的时间开销大。
Jiang H等人根据维基百科中高校列表获取美国大学信息,将大学主页的IP和大学位置信息关联,建立大学网站地标库;同时,利用美国38186个城市和城镇的地理位置及人口,将每个州人口最多的前60个城市和城镇的政府网站与政府位置关联,得到城市/城镇数据集。这种方法仅能获取特定行业的机构信息,所获取的街道级地标数量少。且对大量的网页进行爬取,时间开销较大。
从搜索引擎日志中提取用户搜索的地点名词,并将其与搜索时使用的IP相关联,通过IP聚合,并计算不同地点名词的权值,得到IP的城市级位置。该方法从数据分析的角度进行地标获取,能够获得大量的城市级地标,但该方法在实际使用过程中存在三个限制,一是数据集的获得需要与搜索引擎公司合作;二是从搜索引擎日志中识别提取细粒度地点名词难度较大;三是由于用户在使用搜索引擎的过程中往往不会输入细粒度的位置(如街道级位置),使用该方法很难获得大量的街道级地标。
Wang Y等人提出另外一种基于Web的地标获取方法。该方法的主要思路是:许多公司、企业、政府部门等单位都拥有自己的Web服务器,可以将这些Web服务器与在线地图查询结合起来,实现Web服务器与其地理位置的映射关系。该方法使用区域邮政编码,能够验证获取地标的区县级位置,但该方法仅能获取被在线地图收录的、网络发达地区的Web服务器,地标挖掘的数量和范围有限。
朱光等人提出基于互联网论坛的城市级地标挖掘方法,该方法通过分析不同类型的论坛特点,给出适合作为候选地标挖掘对象的主题论坛,并基于论坛名称中的语义信息推测出论坛用户集中所处的地理位置。与从在线地图中获取地标的方法相比,挖掘的地标数量与范围都增大,该方法获取的地标为城市级地标,无法满足高精度定位对大量街道级地标的需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910128483.6/2.html,转载请声明来源钻瓜专利网。





