[发明专利]一种行人重识别的神经网络加速装置及方法在审
申请号: | 202210371662.4 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114782890A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 陈弟虎;杨升荣;余杨斌 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V40/10;G06V10/82;G06V10/44;G06N3/04 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 梁嘉琦 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行人 识别 神经网络 加速 装置 方法 | ||
1.一种行人重识别的神经网络加速装置,其特征在于,包括:
控制模块,用于产生读控制信号和写控制信号;
缓存模块,包括权重缓存模块和特征缓存模块,所述权重缓存模块用于根据所述写控制信号获取权重并缓存,所述特征缓存模块为多分支网络结构,用于根据所述写控制信号获取输入特征,用于根据所述输入特征计算得到中间特征并缓存;
行缓存模块,用于根据所述读控制信号读取所述权重和所述中间特征,用于将所述权重和所述中间特征重新排列得到权重向量和特征向量;
致密卷积模块,用于根据所述权重向量和所述特征向量进行致密卷积计算,生成第一特征;
深度可分离卷积模块,用于根据所述第一特征生成第二特征,所述第二特征为深度可分离卷积权重,并根据所述第一特征和所述第二特征进行深度可分离卷积计算,得到第三特征;
存储模块,用于将所述第一特征和所述第三特征存入所述特征缓存模块中。
2.根据权利要求1所述的一种行人重识别的神经网络加速装置,其特征在于,所述特征缓存模块的多分支网络结构包括第一特征缓存模块、两个第二特征缓存模块、三个第三特征缓存模块、三个第四特征缓存模块和第五特征缓存模块;
所述第一特征缓存模块根据所述写控制信号获取所述输入特征并缓存,根据所述输入特征进行卷积计算生成中间输出特征并缓存在第一个所述第二特征缓存模块,所述中间输出特征通过Lite 3×3卷积计算生成第一卷积结果、第二卷积结果、第三卷积结果和第四卷积结果,并将所述第一卷积结果存入第一个所述第三特征缓存模块,将所述第二卷积结果存入第一个所述第四特征缓存模块,将所述第三卷积结果存入第二个所述第四缓存模块,将所述第四卷积结果存入第三个所述第四缓存模块,所述第一卷积结果与所述第二卷积结果融合生成第一融合结果并存入所述第五特征缓存模块,所述第一融合结果与所述第三卷积结果融合后生成第二融合结果并存入第二个所述第三特征缓存模块,所述第二融合结果与所述第四卷积结果融合后生成第三融合结果并存入第二个所述第二特征缓存模块,根据所述第三融合结果进行卷积计算生成第五卷积结果并存入第三个所述第三特征缓存模块,根据所述输入特征与所述第五卷积结果进行残差融合,生成所述中间特征并存入所述第一特征缓存模块。
3.根据权利要求2所述的一种行人重识别的神经网络加速装置,其特征在于,所述第一特征缓存模块和所述第四特征缓存模块采用ping-pong缓存结构。
4.根据权利要求2所述的一种行人重识别的神经网络加速装置,其特征在于,所述第一特征缓存模块、所述第二特征缓存模块、所述第三特征缓存模块、所述第四特征缓存模块和所述第五特征缓存模块的存储方式包括特征宽优先和特征通道优先。
5.根据权利要求1所述的一种行人重识别的神经网络加速装置,其特征在于,所述权重缓存模块采用ping-pong缓存结构。
6.根据权利要求1所述的一种行人重识别的神经网络加速装置,其特征在于,所述致密卷积模块包括乘法模块和加法树;
所述乘法模块根据所述权重向量和所述特征向量进行乘法运算,得到乘积向量;所述加法树将所述乘积向量相加,得到所述第一特征。
7.根据权利要求1所述的一种行人重识别的神经网络加速装置,其特征在于,还包括池化模块;
所述池化模块根据所述第一特征进行最大池化计算或者平均池化计算,得到池化结果;所述存储模块将所述池化结果存入所述特征缓存模块中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210371662.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钢包底吹氩控制方法、装置、设备及介质
- 下一篇:一种油烟机的集烟腔及油烟机