[发明专利]一种图片拍摄区域识别及地理定位方法及装置有效
申请号: | 201710064508.1 | 申请日: | 2017-02-04 |
公开(公告)号: | CN108399413B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 李春平;高玺艳;宋韶旭 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06K9/46;G06N3/04;G01C21/00 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 胡艳华;李丹 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 拍摄 区域 识别 地理 定位 方法 装置 | ||
本发明公开了一种图片拍摄区域识别及地理定位方法及装置,所述方法包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。本发明实施例通过识别待测图片的特征向量,进而计算该特征向量所属的特征向量簇,得到地理区域信息,实现简便,效率高;通过测距网络得到待测图片的地理位置,提高了识别准确度和识别速度。
技术领域
本发明涉及定位技术领域,尤指一种图片拍摄区域识别及地理定位方法及装置。
背景技术
车辆智能化是保证交通安全和提高交通效率的重要途径,而智能驾驶是车辆智能化的终极目标。如何精确定位车辆是实现自动驾驶的重要内容,目前最常见的定位方式主要是通过在车辆上配备的全球定位系统(GlobalPositioning System,GPS)进行定位,然而全球定位系统在某些场合下例如建筑物附近、地下通道等信号极弱,因此定位精度远远不能满足定位的要求。
目前已有的图片定位方法大致有以下两种。第一种是SLAM(即时定位与地图构建),通过在未知环境下创建地图,同时利用地图进行自主定位和导航;第二种是基于内容(Appearance-based)的方法,最常见的方法是使用SIFT(Scale-invariant featuretransform,尺度不变特征转换)特征点描述图片,然后通过这些特征点与数据库中位置已知的特征点进行匹配,确定图片的拍摄位置。然而对于以上两种图片定位方法,SLAM需要实时重建地图,时间和空间消耗较大,难以满足实时定位的需求;基于内容的方法定位,需要一个存储大量特征和地理位置的数据库,并且特征点检索耗时较大。
发明内容
为了解决上述技术问题,本发明提供了一种图片拍摄区域识别及地理定位方法及装置,以提高识别准确度和识别速度。
为了达到本发明目的,本发明提供了一种图片拍摄区域识别及地理定位方法,包括:
输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;
计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;
使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。
可选地,所述输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量之前,所述方法还包括:
输入已知的图片集合,训练特征提取网络,得到图片特征提取器;其中,所述图片集合中的图片包含位置信息;
通过所述图片特征提取器提取所述图片集合中所有图片的特征向量,得到图片特征向量集,对所述图片特征向量集进行密度聚类,形成多个特征向量簇;
使用同一个特征向量簇中的每两个特征向量组成输入对训练测距网络,用于将输入的两个特征向量映射为两个图片拍摄地点的距离。
可选地,所述输入已知的图片集合,训练特征提取网络,得到图片特征提取器之前,还包括:
在多个区域中每个地点在多种条件下采集多幅图片,对采集到的图片进行预处理,生成预定义尺寸大小的图片,作为已知的图片集合。
可选地,所述特征提取网络为卷积神经网络,包括卷积层、池化层和全连接层;
所述测距网络为神经网络,包括输入层、隐含层和输出层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710064508.1/2.html,转载请声明来源钻瓜专利网。