[发明专利]神经网络数据处理装置和方法有效
申请号: | 201780088904.6 | 申请日: | 2017-03-24 |
公开(公告)号: | CN110462637B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 亚采克·科涅奇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 数据处理 装置 方法 | ||
本发明涉及一种数据处理装置(100),包括处理器(101),用于提供神经网络(110),其中,所述神经网络(110)包括用于基于多个位置相关内核(118)和多个输入数据值数组(117),根据所述输入数据值数组(117)生成输出数据值数组(121)的神经网络层(120)。此外,本发明还涉及一种相应的数据处理方法。
技术领域
本发明大体涉及基于神经网络的机器学习或深度学习领域。更具体地,本发明涉及一种神经网络数据处理装置和方法,尤其涉及音频处理、计算机视觉、图像或视频处理、分类、检测和/或识别领域的数据处理。
背景技术
加权聚合是一个整合输入数据以将较大空间区域内呈现的信息打包到一个单独空间位置的过程,包括采用控制每个输入数据值对结果的影响的聚合权重的形式的附加输入,通常用于许多信号处理应用,例如用于图像质量改进、深度或视差估计的图像处理方法,以及许多其它应用【Kaiming He、Jian Sun、Xiaoou Tang,“导向图滤波”,ECCV 2010】。
在深度学习领域,许多应用领域中近期使用的常见方法是利用卷积神经网络。通常,此类卷积神经网络的一个特定部分是:至少一个卷积层使用通过学习获知的内核K对输入数据值进行卷积处理,所述内核对每个输出位置的每个卷积核生成一个输出数据值【J.Long、E.Shelhamer、T.Darrell,“用于语义分割的全卷积网络”,CVPR 2015】。例如,对于在图像处理领域使用的二维案例,使用所述通过学习获知的内核K的所述卷积在数学上可以表示如下:
其中,out(x,y)表示输出数据值数组,in(x-i,y-j)表示输入数据值数组的子数组,K(i,j)表示包括内核权重或内核值(2r+1)x(2r+1)的数组的所述内核。B表示可选的通过学习获知的偏置项,可添加用于获取每个输出数据值。所述内核K的权重与输入数据值的整个数组in(x,y)一致,通常在所述神经网络学习阶段获知;如果采用一阶方法,则所述神经网络包括以迭代方式将神经网络输出梯度反向传播至输入层,以及按照通过这种方式计算的偏导数更新所有网络层的权重。
发明内容
本发明的目的在于提供一种基于神经网络的更完善的数据处理装置和方法。
上述和其它目的通过独立权利要求的主题来实现。根据从属权利要求、说明书以及附图,进一步的实现方式是显而易见的。
通常,本发明的实施例提供了用于作为新型神经网络层在神经网络中实现的神经网络数据加权聚合的新方法。所述神经网络层可以使用针对每个单独空间位置获知的单独聚合权重计算聚合数据。聚合权重可以计算为相似性和通过学习获知的权重核的函数,继而获知每个输出空间位置的单独聚合权重。这样,便可以利用通过所述神经网络获知的各种复杂的位置相关或位置自适应内核,使所述聚合权重更加适应输入数据。
更具体地,根据第一方面,本发明涉及一种数据处理装置,所述数据处理装置包括一个或多个用于提供神经网络的处理器。例如,将使用所述数据处理装置处理的数据可以是二维图像或视频数据或一维音频数据。
由所述数据处理装置的一个或多个处理器提供的神经网络包括神经网络层,用于将输入数据值数组(例如输入数据值的二维数组in(x,y))处理成输出数据值数组(例如输出数据值的二维数组out(x,y))。所述神经网络层可以是所述神经网络的第一层,也可以是中间层。
输入数据值数组可以是一维数组(即向量,例如音频或其它,例如时间序列)、二维数组(即矩阵,例如图像或其它时间或空间序列)或N维数组(例如由传统预处理或特征提取和/或神经网络其它层提供的任何类型的N维特征数组)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780088904.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:黑盒优化的系统和方法
- 下一篇:使用后验锐化训练神经网络