[发明专利]在连接网络中处理图像数据的方法有效
申请号: | 201811465502.6 | 申请日: | 2018-12-03 |
公开(公告)号: | CN110033009B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 朱维檬;J·西格蒙德 | 申请(专利权)人: | APTIV技术有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 黄纶伟;李辉 |
地址: | 巴巴多斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连接 网络 处理 图像 数据 方法 | ||
在连接网络中处理图像数据的方法,网络包括具有数据输入端、数据输出端和至少一个处理参数的多个单元,由单元处理输入数据至少部分由单元的处理参数确定,该方法实现多个单元中的一个独立单元,包括:接收代表由图像传感器获取的图像的输入图片元素作为原始输入数据或经单元中的在前单元处理的输入数据;确定输出图片元素的偏移,偏移表示输出图片元素中基础输出图片元素的位置偏移;根据偏移确定用于从输入图片元素采样的包括多个采样位置的网格,由偏移中的一个与输出图片元素的基础图片元素的对定义各采样位置;根据网格从输入图片元素采样;将采样图片元素作为至少连接网络的单元中的在后单元的输出数据发送,采样图片元素形成输出图片元素。
技术领域
本发明涉及一种在包括多个单元的连接网络(connectionist network)(尤其是神经网络)中处理图像数据的方法,各单元具有数据输入端、数据输出端和至少一个处理参数。借助一个单独的单元来处理输入数据至少部分地由该单元的至少一个处理参数来确定。连接网络在机器学习领域中是已知的,其通常涉及某种算法训练,在该算法训练期间,基于训练数据推导出处理参数的合适值。通常,可以采用如本文所描述的连接网络来进行受监督和无监督的机器学习。然而,术语连接网络应该被广义地理解并且也涵盖本身并不被称为由机器学习训练的模型的那些模型。
背景技术
连接网络是数学上受启发的模型,其由互连的处理单元组成,其中,给定单元可以具有来自许多其它单元的输入连接或至许多其它单元的输出连接。因此,各单元具有至少一个数据输入端和至少一个数据输出端。多个单元可以布置在后续层中并且彼此互连,如从人工神经网络设计中公知的那样。给定网络的多个单元可以具有相同或不同的结构。有时采用单元组,其中,给定组中的单元具有仅因组而异的公共预定结构。如技术人员所理解的,连接网络优选被实现为软件,这意味着本文所描述的网络结构不表示硬件结构,而是表示用电子方式实现的方法。
通常,连接网络可用于其中需要进行某种数据处理的各种应用。一种应用是图像分类,图像分类可涉及将图像的内容或其部分分类为多个预定义的语义上有意义的组中的至少一个。也就是说,借助模拟或数字图像传感器获取的原始图像数据被变换成表示内容或对象类的离散变量。例如,在交通环境中,分类器可以将对象分类为“车辆”、“行人”和“未知”组中的一个。另一个应用可以是将原始图像数据变换成描述图像内容的连续变量。在交通环境中,距离变量可以给出与最近对象的近似距离。
近来特别受关注的一组应用是高级驾驶员辅助系统(ADAS)(例如,前向碰撞警告(FCW)、行人检测(PED)或交通标志识别(TSR))的领域。所有这些应用都涉及被认为特别具有挑战性的图像分类,因为例如用于分类的相关对象通常仅部分被图像覆盖或者多个对象存在于一个图像中。此外,对象经常出现在偏离了训练给定分类器的对象的标准或规范形式的空间变换形式中。更具挑战性的一个方面是应该被指派(即,分类)到一组的对象可能具有多种不同的形状。这种问题的一个示例是识别具有特定的语义含义即“取消每小时80公里的最大允许速度”的简单交通标志。虽然此交通标志通常包括数字80和覆盖数字的对角线条,但是所涉及的对象即数字80的字体和对角线条的确切形状对于例如欧盟地域内的不同国家而言是有偏差的。
作为连接网络的一个非限制示例,可采用(人工)神经网络进行以上提到的分类任务。如此,连接网络可以包括本领域中已知的神经网络结构,例如,完全连接的层和池化层。然而,经证明,即使训练有素的神经网络(也可能包括复杂结构)的性能在空间变换的对象被分类时也会大大劣化,尤其是与图像采集的次优条件(这通常是室外交通环境中的情况)相结合时。此外,待分类对象的不同实施方式(即,形式或形状)通常使分类器的“经训练的性能”显著降低。当借助多元回归模型将图像或其它类型的数据映射到一个或更多个连续变量时,可能出现相同的问题。也就是说,这些问题不仅仅针对神经网络来说是致命的。因此,根据本发明的解决方案原则上也适用于任意模型类型。
发明内容
本发明的一个目标是提供一种能够克服以上提到的问题的用于在连接网络中处理图像数据的改进方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于APTIV技术有限公司,未经APTIV技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811465502.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序