[发明专利]一种深度神经网络运算方法及装置在审
| 申请号: | 201811307229.4 | 申请日: | 2018-11-05 |
| 公开(公告)号: | CN111144560A | 公开(公告)日: | 2020-05-12 |
| 发明(设计)人: | 陈伟杰;张渊;谢迪;浦世亮 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
| 地址: | 310051 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 深度 神经网络 运算 方法 装置 | ||
1.一种深度神经网络运算方法,其特征在于,所述方法包括:
获取网络层输入特征图;
按照预设位移参数,将所述网络层输入特征图的每个通道分别沿各轴向进行位移,得到位移特征图,其中,所述预设位移参数包括每个通道在各轴向上的位移量;
利用1×1卷积核,对所述位移特征图进行卷积运算,得到网络层输出特征图。
2.根据权利要求1所述的方法,其特征在于,所述位移量为预设的多个不同偏移量的平均分布。
3.根据权利要求1所述的方法,其特征在于,所述预设位移参数经过预先学习得到;
所述预设位移参数的学习方式,包括:
获取初始的位移参数;
将所述位移参数中的位移量转化为浮点位移量;
根据所述网络层输入特征图以及所述浮点位移量,利用双线性插值算法,得到网络层输出函数;
根据所述深度神经网络的输入数据、所述1×1卷积核、所述位移参数以及所述输入数据对应的标签,确定所述深度神经网络的网络损失值;
根据所述网络层输出函数,计算所述网络损失值对所述位移参数的梯度,并利用梯度下降法,对位移参数进行多次迭代更新,得到预设位移参数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述深度神经网络的输入数据、所述1×1卷积核、所述位移参数以及所述输入数据对应的标签,确定所述深度神经网络的网络损失值,包括:
根据所述深度神经网络的输入数据、所述1×1卷积核、所述位移参数以及所述输入数据对应的标签,计算所述深度神经网络的网络损失函数;
根据所述1×1卷积核,计算第一正则项;
根据所述位移参数,计算第二正则项;
对所述网络损失函数、所述第一正则项及所述第二正则项进行加权,得到所述深度神经网络的网络损失值。
5.根据权利要求3所述的方法,其特征在于,所述按照预设位移参数,将所述输入特征图的每个通道分别沿各轴向进行位移,得到位移特征图,包括:
对所述预设位移参数中的浮点位移量进行四舍五入取整操作,得到整型位移量;
按照所述预设位移参数中的整型位移量,将所述输入特征图的每个通道分别沿各轴向进行位移,得到位移特征图。
6.一种深度神经网络运算装置,其特征在于,所述装置包括:
获取模块,用于获取网络层输入特征图;
位移模块,用于按照预设位移参数,将所述网络层输入特征图的每个通道分别沿各轴向进行位移,得到位移特征图,其中,所述预设位移参数包括每个通道在各轴向上的位移量;
运算模块,用于利用1×1卷积核,对所述位移特征图进行卷积运算,得到网络层输出特征图。
7.根据权利要求6所述的装置,其特征在于,所述位移量为预设的多个不同偏移量的平均分布。
8.根据权利要求6所述的装置,其特征在于,所述预设位移参数经过预先学习得到;
所述装置还包括:学习模块;
所述学习模块,用于:
获取初始的位移参数;
将所述位移参数中的位移量转化为浮点位移量;
根据所述网络层输入特征图以及所述浮点位移量,利用双线性插值算法,得到网络层输出函数;根据所述深度神经网络的输入数据、所述1×1卷积核、所述位移参数以及所述输入数据对应的标签,确定所述深度神经网络的网络损失值;
根据所述网络层输出函数,计算所述网络损失值对所述位移参数的梯度,并利用梯度下降法,对位移参数进行多次迭代更新,得到预设位移参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811307229.4/1.html,转载请声明来源钻瓜专利网。





