[发明专利]用于目标识别的神经网络终端运行方法和装置有效
申请号: | 201811609115.5 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109740619B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 胡博;赖永安;唐翊洪;孟博;高楠 | 申请(专利权)人: | 北京航天飞腾装备技术有限责任公司 |
主分类号: | G06K9/52 | 分类号: | G06K9/52;G06K9/62 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 陈鹏 |
地址: | 100097 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 目标 识别 神经网络 终端 运行 方法 装置 | ||
1.一种用于目标识别的神经网络终端运行方法,其特征在于,包括:
获取已经训练好的深度卷积神经网络模型;
将所述深度卷积神经网络的模型参数存储进外部存储器DDR,其中,所述模型参数包括全连接层参数和经过预处理的卷积层参数;
将所述深度卷积神经网络的模型架构存储进系统级芯片FPGA,其中,所述模型架构中的卷积层分配入编程逻辑模块PL,所述模型架构中的池化层、全连接层和激活层分配入控制单元模块PS;
采用所述深度卷积神经网络模型对目标图像进行处理,识别所述目标;
其中,所述预处理为:在对所述深度卷积神经网络模型进行移植前,对原卷积层参数进行2DFFT计算;
采用所述深度卷积神经网络模型对所述目标图像进行处理,识别所述目标,包括:提取所述卷积层参数到所述PL,根据所述卷积层和所述目标图像,在所述PL中进行卷积层计算,得到所述目标图像的特征数据;提取全连接层参数到所述PS,根据所述池化层、所述全连接层、所述激活层和所述特征数据,在所述PS中进行计算,得到并输出所述目标的识别结果。
2.根据权利要求1所述的方法,其特征在于,提取所述卷积层参数到所述PL,根据所述卷积层和所述目标图像,在所述PL中进行卷积层计算,得到所述目标图像的特征数据,包括:
设计卷积层计算模块,所述卷积层计算模块用于进行卷积核计算,其中,所述卷积层有多个,所述目标图像每一个卷积层中有多个卷积核,所述卷积层计算模块有多个;
根据所述PL,分配不同的卷积层计算模块进行并行计算;
根据所述目标图像和多个卷积层计算模块,得到所述目标图像的特征数据。
3.根据权利要求2所述的方法,其特征在于,设计卷积层计算模块,包括:
采用二维快速傅里叶变换2DFFT对所述目标图像进行计算,获取所述目标图像的频域图像数据;
将所述频域图像数据与所述卷积层参数进行复数乘法计算;
采用二维快速傅里叶逆变换2DIFFT对复数乘法计算后的数据进行处理,并对处理后的结果进行实部提取,并输出。
4.根据权利要求3所述的方法,其特征在于,
采用2DFFT对所述目标图像进行计算,包括:
针对原图图像IMG(x,y),依次选取各行中数据做1DFFT处理:
针对上一步计算结果,依次选取各列中数据再做1DFFT处理:
采用2DIFFT对复数乘法计算后的数据进行处理,包括:
对复数乘法计算后的数据IMG_K(x,y)依次选取各行中数据做1DIFFT处理:
针对上一步计算结果,依次选取各列中数据再做1DIFFT处理:
其中,K1、P1、K2、P2均为频域变换后参数;M为所述目标图像中像素的行数,N为所述目标图像中像素的列数。
5.根据权利要求2所述的方法,其特征在于,在所述PL中每进行完一次卷积层计算模块的计算,均通过中断系统通知所述PS进行下一次计算的调度。
6.根据权利要求2所述的方法,其特征在于,第一卷积层参数精度为INT32,第二卷积层参数精度为INT16,第三卷积层参数精度为INT8,第四卷积层及其他卷积层参数精度均为INT4。
7.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1到6所述的任意一项的用于目标识别的神经网络终端运行方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天飞腾装备技术有限责任公司,未经北京航天飞腾装备技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811609115.5/1.html,转载请声明来源钻瓜专利网。