[发明专利]一种基于FPGA加速的MobileNet-SSD目标检测装置及方法有效
申请号: | 202110434593.2 | 申请日: | 2021-04-22 |
公开(公告)号: | CN113051216B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 程明;潘国标 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06F13/42;G06N3/0464;G06N3/063 |
代理公司: | 南京灿烂知识产权代理有限公司 32356 | 代理人: | 赵丽 |
地址: | 211816 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fpga 加速 mobilenet ssd 目标 检测 装置 方法 | ||
1.一种基于FPGA加速的MobileNet-SSD目标检测方法,其特征在于,包括如下步骤:
Step1:获取待检测目标初始图像,存储目标初始图像数据和卷积神经网络权值文件;
Step2:在Mobilenet-SSD卷积神经网络中加入检测层,在不同网络层间共享加速器,加速器上设置片上缓冲区;
Step3:通过并行分块参数优化法运行Mobilenet-SSD卷积神经网络,输出目标图像的特征图通道和卷积核通道的分块系数;
Step4:通过流水线算法,完成Mobilenet-SSD卷积神经网络的目标特征提取、边界框回归及物体类别预测;
Step5:对卷积神经网络得到的目标特征提取、边界框回归及物体类别预测信息进行后处理;
Stsp6:在待检测目标图像上测试目标检测结果;
其中,Step3中并行分块参数优化法包括如下步骤:
Step3.1:分别计算输入特征值的宽和高的分块系数Twi和Thi:
Twi=S*Tw+K-S (1)
Thi=S*Th+K-S (2)
其中,Twi表示输入特征值的宽的分块系数,Thi表示输入特征值的高的分块系数,Tw表示输出特征图的宽的分块系数,Th表示输出特征图的高的分块系数,K表示卷积核的大小,S表示卷积步长,
Step3.2:基于分块系数,计算通信比CR:
其中,CR表示通信比,W表示输出特征图的宽,H表示输出特征图的高,M表示输出特征图的通道数,N表示输出特征图的卷积核通道数,K表示卷积核的大小,αin表示输入层所需计算存储的所有分块数,βin表示输入层所需计算存储的分块数大小,αw表示卷积层所需计算存储的所有分块数,βw表示卷积层所需计算存储的分块数的大小,αout表示输出层所需计算存储的所有分块数,βout表示输出层所需计算存储的分块数的大小,
上述公式中,αin、βin、αw、βw、αout和βout分别基于下述公式求解:
βin=TniTwiThi (4)
βw=TmTnK2 (5)
βout=TmTwTh (6)
其中,Tni表示输入特征图的通道对应的分块系数,Tw表示输出特征图的宽的分块系数,表示,Th表示输出特征图的高的分块系数,Tm表示输出特征图的通道数的分块系数,Tn表示输出特征图的卷积核通道数的分块系数,
Step3.3:按照资源瓶颈近似公式,计算资源瓶颈R:
其中,R表示资源瓶颈,与总操作数和系统时钟频率正向相关,与执行周期数反向相关,Step3.4:基于约束条件,在Mobilenet-SSD卷积神经网络下求解全局最优的Tm和Tn:
其中,C0为片上缓存量,AP表示可取的计算能力,TW表示带宽;
Step4中流水线包括如下步骤:
Step4.1:将Mobilenet-SSD卷积神经网络中不同数据流的计算步骤在一个时钟周期内完成;
Step4.2:在一定阈值下回归出类别概率较高的预测框的真实位置并进行降序排列;
Step4.3:不同数据缓冲模块在不同时钟周期分别读写数据;
Step4.4:每达到时钟周期的一半时,每个数据缓冲模块一边继续读数据,一边将前半个时钟周期读取的数据开始向数据处理模块写入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110434593.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可折叠显示器
- 下一篇:一种微电解式次氯酸伤口敷料贴及使用方法