[发明专利]一种基于结构重参数化的模型推理速度提升方法及装置在审
| 申请号: | 202210076146.9 | 申请日: | 2022-01-23 |
| 公开(公告)号: | CN114611700A | 公开(公告)日: | 2022-06-10 |
| 发明(设计)人: | 周祖煜;白博文;林波;陈煜人;张澎彬;莫志敏;张浩;李天齐;刘俊 | 申请(专利权)人: | 杭州领见数字农业科技有限公司 |
| 主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/04;G06N3/08 |
| 代理公司: | 杭州快知知识产权代理事务所(特殊普通合伙) 33293 | 代理人: | 杨冬玲 |
| 地址: | 310000 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 结构 参数 模型 推理 速度 提升 方法 装置 | ||
1.一种基于结构重参数化的模型推理速度提升方法,其特征在于,包括:
获取样本数据并按照多分支结构进行训练,得到训练模型,所述训练模型包括残差连接大层,且所述残差连接大层包括1×1卷积层和3×3卷积层;
将所述残差连接大层的非线性层放在所述残差连接大层的最后一层,再根据Conv层与BN层融合的技术对所述1×1卷积层和所述3×3卷积层进行融合,得到卷积融合层并完成所述残差连接大层的融合,以得到结构重参数化的检测模型。
2.根据权利要求1所述的一种基于结构重参数化的模型推理速度提升方法,其特征在于,所述Conv层与BN层融合的技术,包括:
分别将Conv层的表达式Conv=Wc*x+Bc和BN层的表达式带入公式y=BN(Conv(x))中进行计算,得到第一公式其中x为所述Conv层的输入,y为所述Conv层的输出,Wc为所述Conv层的权重,Bc为所述Conv层的偏置项,γ为所述BN层的缩放系数,β为所述BN层的偏移系数,E为所述BN层的均值,var为所述BN层的方差;
对所述第一公式进行变形,得到第二公式所述第二公式为一元一次方程,完成所述Conv层和所述BN层的融合。
3.根据权利要求2所述的一种基于结构重参数化的模型推理速度提升方法,其特征在于,所述将所述残差连接大层的非线性层放在所述残差连接大层的最后一层,再根据Conv层与BN层融合的技术对所述1×1卷积层和所述3×3卷积层进行融合,得到卷积融合层并完成所述残差连接大层的融合,以得到结构重参数化的检测模型,包括:
步骤一、将所述残差连接大层的非线性层放在所述残差连接大层的最后一层;
步骤二、预设所述残差连接大层的输入为输出为
步骤三、当C1=C2,H1=H2,W1=W2时,可得所述输入M1与所述输出M2的关系式为:且所述残差连接大层的权重为所述残差连接大层的偏置为其中表示从1开始,i表示通道,C1为所述残差连接大层的输入通道,C2为所述残差连接大层的输出通道,N是batch_size,H1、W1是输入特征的高和宽,H2,W2是输出特征的高和宽,var(3),E(3),β(3),γ(3)分别表示3x3 Conv之后的BN的方差、均值、偏置系数、缩放系数,var(1),E(1),β(1),γ(1)分别表示1x1 Conv之后的BN的方差、均值、偏置系数、缩放系数,var(0),E(0),β(0),γ(0)分别表示identity之后的BN的方差、均值、偏置系数、缩放系数,identity表示一个层;
步骤四、根据所述步骤一、所述步骤二、所述步骤三可得,所述残差连接大层按照所述Conv层与BN层融合的技术可以完成融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州领见数字农业科技有限公司,未经杭州领见数字农业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210076146.9/1.html,转载请声明来源钻瓜专利网。





