[发明专利]一种神经网络实时结构化剪枝的方法和系统在审
申请号: | 202310285559.2 | 申请日: | 2023-03-22 |
公开(公告)号: | CN116432739A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 杨清海;尹泽芃 | 申请(专利权)人: | 西安电子科技大学广州研究院 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/0464 |
代理公司: | 广东省中源正拓专利代理事务所(普通合伙) 44748 | 代理人: | 朱靖华 |
地址: | 510000 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 实时 结构 剪枝 方法 系统 | ||
1.一种神经网络实时结构化剪枝的方法,其特征在于:将所述神经网络的算法过程拆解为若干阶段,所述方法包括如下步骤:
S101,配置数据检测方案;
S102,计算本阶段输入数据并将计算结果写入存储单元;
S103,根据所述数据检测方案对所述计算结果进行检测,并获得其数据特征;
S104,判断所述数据特征是否满足剪枝要求,若满足,则对所述计算结果进行剪枝操作;否则,将所述计算结果作为后续阶段输入数据,并执行步骤S105;
S105,重复执行步骤S101~步骤S104;
其中,所述步骤S102和步骤S103同时进行。
2.根据权利要求1所述的一种神经网络实时结构化剪枝的方法,其特征在于:在所述算法过程的不同阶段采用相同或不同的数据检测方案。
3.根据权利要求1所述的一种神经网络实时结构化剪枝的方法,其特征在于:计算单元从所述存储单元中读取本阶段的待计算数据,并将其作为所述本阶段输入数据进行计算。
4.根据权利要求1所述的一种神经网络实时结构化剪枝的方法,其特征在于:所述数据检测方案包括方案一和方案二,根据模型精度的损失程度选择所述数据检测方案;其中,所述方案一为:检测所述计算结果是否全部为0;所述方案二为:检测所述计算结果的所述数据特征是否超过阈值,所述阈值包括第一阈值和第二阈值。
5.根据权利要求4所述的一种神经网络实时结构化剪枝的方法,其特征在于:所述数据特征包括:非0值的稀疏程度、最大值、最小值和均值。
6.根据权利要求5所述的一种神经网络实时结构化剪枝的方法,其特征在于:所述剪枝要求包括:要求一、要求二和要求三;其中,所述要求一为:所述计算结果均为0;所述要求二为:所述计算结果的最大值、最小值和均值未超过所述第一阈值;所述要求三为:所述非0值的稀疏程度未超过所述第二阈值。
7.根据权利要求1所述的一种神经网络实时结构化剪枝的方法,其特征在于:若所述数据特征满足所述剪枝要求,则释放本阶段数据占用的存储空间;其中,若所述本阶段数据满足所述剪枝要求并进行所述剪枝操作,则不执行后续阶段计算。
8.一种神经网络实时结构化剪枝的系统,其特征在于:包括计算单元、存储单元和数据检测单元;
所述计算单元,用于进行算法运算,包括相关设备和电路;其中,所述相关设备和电路具有处理算法的功能;
所述存储单元与所述计算单元连接,具有数据存储功能,用于对计算数据进行存储;其中,所述计算数据包括待计算数据、计算中间值和计算结果;
所述数据检测单元与所述计算单元连接,用于对所述计算单元输出的所述计算数据进行特征检测;
其中,将所述计算数据写入所述存储单元的操作与检测所述计算数据的操作同时进行。
9.根据权利要求8所述的一种神经网络实时结构化剪枝的系统,其特征在于:所述数据检测单元以独立单元的形式或者嵌入到所述计算单元、所述存储单元的形式进行数据检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学广州研究院,未经西安电子科技大学广州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310285559.2/1.html,转载请声明来源钻瓜专利网。