[发明专利]用于计算机视觉的方法和装置在审
| 申请号: | 201880093704.4 | 申请日: | 2018-05-24 |
| 公开(公告)号: | CN112368711A | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 张志杰 | 申请(专利权)人: | 诺基亚技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 杨晓光 |
| 地址: | 芬兰*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 计算机 视觉 方法 装置 | ||
公开了用于计算机视觉的方法和装置。该方法可以包括通过使用神经网络来处理图像的第一输入特征图以获得该图像的输出特征图。所述神经网络可以包括至少两个分支和第一相加块,所述至少两个分支中的每个分支包括至少一个第一膨胀卷积层、至少一个第一上采样块和至少一个第二相加块,在分支中的第一膨胀卷积层的膨胀率与另一分支中的第一膨胀卷积层的膨胀率不同,所述至少一个第一上采样块被配置为对所述第一输入特征图或由所述至少一个第二相加块输出的特征图进行上采样,所述至少一个第二相加块被配置为将被上采样的特征图与所述图像的第二输入特征图分别相加,所述第一相加块被配置为将由所述至少两个分支中的每一个分支输出的特征图相加,所述第一膨胀卷积层具有一个卷积核,以及所述第一膨胀卷积层的输入通道单独执行膨胀卷积以作为所述第一膨胀卷积层的输出通道。
技术领域
本公开的实施例总体上涉及信息技术,并且更具体地涉及计算机视觉。
背景技术
计算机视觉是涉及如何使计算机能够从数字图像或视频获得高级理解的领域。计算机视觉在许多应用中起着重要作用。计算机视觉系统广泛用于各种视觉任务,例如场景重建、事件检测、视频跟踪、对象识别、语义分割、三维(3D)姿态估计、学习、索引、运动估计、和图像恢复。例如,图像识别系统可以用于视频监控、交通监控、驾驶员辅助系统、自动驾驶汽车、交通监测、人员识别、人机交互、公共安全、事件检测、跟踪、边防警卫和海关、场景分析和分类、图像索引和检索等。
语义分割被委以以下任务:在像素级别对给定图像进行分类以实现对象分割的效果。语义分割的过程是将输入图像分割为多个区域,这些区域被分类为预定义的类别之一。
语义分割技术在语义解析、场景理解、人机交互(HMI)、视觉监视、高级驾驶员辅助系统(ADAS)、无人机系统(UAS)等方面具有广泛的实际应用。将语义分割应用于所捕获的图像上,图像可以被分割成语义区域,其中该图像的类别标签(例如,行人、汽车、建筑物、桌子、花)是已知的。当给出适当的查询时,具有分割信息的感兴趣对象、感兴趣区域可以被有效地搜索。
在自动驾驶汽车的应用中,了解诸如道路场景之类的场景可能是需要的。给定捕获的图像,车辆被要求能够识别可用的道路、车道、灯、人、交通标志、建筑物等,然后车辆可以根据识别结果进行适当的驾驶操作。驾驶操作可能依赖于语义分割的高性能。如图1所示,位于汽车顶部的摄像头捕获图像。语义分割算法可以将捕获的图像中的场景分割为具有12个类别的区域:天空,建筑物、杆、道路标记、道路、人行道、树木、标志符号、栅栏、车辆、行人、和自行车。场景的内容可以为汽车准备下一个操作提供指导。
发明内容
以简化形式提供本发明内容以介绍选择的构思,在下面的详细描述中进一步描述它们。本发明内容既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
深度学习在增强语义分割方法的性能中起高效作用。例如,基于空间金字塔池(SPP)的深度卷积网络已经用在语义分割中。在语义分割中,SPP由若干并行的特征提取层和融合层组成。并行特征提取层用于捕获不同感受野(receptive field)的特征图,而融合层则用于探测不同感受野的信息。
基于SPP的传统语义分割网络通常以低分辨率执行SPP以进行特征提取,然后以较大的比率将结果直接上采样到原始输入分辨率以用于最终预测。但是,基于SPP的传统语义分割网络存在以下一些问题:
·传统的语义分割网络以较低的分辨率执行SPP,这导致较差的提取的特征。
·传统的语义分割网络以较大的比率对特征图进行上采样,这导致严重的网格效应和较差的视觉质量。
·传统的语义分割网络可能会导致过多的参数和信息冗余。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚技术有限公司,未经诺基亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880093704.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制备普瑞巴林的方法
- 下一篇:未许可频谱中的探测参考信号传输





