[发明专利]一种面向移动终端的轻量化开集地标识别方法在审
| 申请号: | 202110184512.8 | 申请日: | 2021-02-10 |
| 公开(公告)号: | CN112818893A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 胡永利;贾林涛;张勇;苗壮壮;尹宝才 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 移动 终端 量化 地标 识别 方法 | ||
一种面向移动终端的轻量化开集地标识别方法,属于计算机视觉领域。本发明首先基于MobileNet‑V2轻量化网络进行改进,使其适用于地标识别任务,然后利用辅助训练集并构建新损失函数,从而提高网络的外分布异常检测能力,最后使用多项指标评估网络性能。本发明基于轻量化神经网络模型并结合外分布检测方法,使部署在移动端的模型既能排除异常图像干扰,又能高效识别任务内地标建筑,同时具备低延迟和轻量的优势。
技术领域
本发明属于计算机视觉领域,具体涉及神经网络、地标识别、外分布检测等知识。
背景技术
地标建筑作为人类日常活动区域中的重要特征,如果能在真实环境下针对特定场景的建筑方位实现精准检测与识别,可以为自主导航、旅游服务业等第三方产业提供重要支持。当前随着以深度学习为特征的人工智能和物联网技术的快速发展,为在移动终端上识别高分辨率的自然场景图像奠定了重要基础。
传统识别方法包括支持向量机、K近邻、最大相关系数、自适应高斯分类器、卷积神经网络等,以卷积神经网络为例,假设输入样本属于已知分布某类,经特征提取通过Softmax层输出概率来预测结果。由于实际应用中面临开集环境,网络往往会遇到大量未知图像,若继续使用传统的闭集识别方法,将会把所有输入错误地判断为已知类别。使用开集识别方法的网络模型在真实环境中不仅能拒绝外分布异常图像还能正确识别任务内地标建筑。从异常检测的角度看,传统学习方法通常假设模型训练和测试的数据独立同分布,而实际在网络部署后,测试图像往往不受控制。目前基于深度学习的地标识别方法很容易将任意图像识别为任务内类别并给出高置信度,这显然不合理。因此,使深度神经网络能排除外分布异常并实现精准识别,将赋予人工智能产业更高的应用价值。
另一方面,随着移动物联网技术的发展,诸如手机等智能移动设备已成为人类日常生活中的重要组成部分。基于移动终端完成地标识别,需要神经网络模型满足尺寸、延迟及准确率等严苛要求。当前深度卷积神经网络虽已普遍用于计算机视觉领域并取得了优异性能,但因过度追求识别精度,模型越来越大,复杂度也越来越高。例如ResNet的层数最大可达152层,VGG-16虽有16层,但其参数量却高达到138M,这在移动终端是难以应用的。首先是模型过大面临内存不足的问题,其次不满足快速响应的要求,如在自动驾驶系统中,识别太慢会使发生危险的可能性显著增加。因此针对移动终端,合理设计轻量高效的神经网络至关重要。
综上所述,针对移动终端的开集地标识别问题,本发明基于轻量化神经网络并结合外分布检测方法,使移动终端能在开集环境下轻量且高效地完成地标识别任务。
发明内容
本发明针对移动终端资源有限和地标识别时存在异常图像干扰的问题,基于轻量化神经网络模型并结合外分布检测方法,使部署在移动端的模型既能排除异常图像干扰,又能高效识别地标建筑,同时具备低延迟和轻量优势。
首先基于MobileNet-V2轻量化网络进行改进,使其适用于地标识别任务;然后利用辅助训练集并构建新损失函数,从而提高外分布异常检测能力,最后使用多项指标评估网络性能。此外还包括数据集处理、模型训练测试等细节,具体步骤如下。
1基于MobileNet-V2的轻量化网络
MobileNet-V2是针对手机和资源有限的设备专门设计的神经网络结构。它在保证准确率的同时,通过减少参数运算量和所需内存,使网络高效运行。基于MobileNet-V2改进后的网络结构如图1所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110184512.8/2.html,转载请声明来源钻瓜专利网。





