[发明专利]一种高效的卷积神经网络运算指令集架构构建方法及装置、服务器有效
| 申请号: | 202011352915.0 | 申请日: | 2020-11-26 | 
| 公开(公告)号: | CN112348179B | 公开(公告)日: | 2023-04-07 | 
| 发明(设计)人: | 张将将;石皓冰 | 申请(专利权)人: | 湃方科技(天津)有限责任公司 | 
| 主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/0464 | 
| 代理公司: | 天津玺名知识产权代理有限公司 12237 | 代理人: | 陈杰 | 
| 地址: | 300000 天津市滨海新区天津中新生态*** | 国省代码: | 天津;12 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 高效 卷积 神经网络 运算 指令 架构 构建 方法 装置 服务器 | ||
1.一种高效的卷积神经网络运算指令集架构构建方法,其特征在于:指令由指令包进行组织,每个指令包包含多条指令;
每条所述指令均包含opcode信息,所述opcode信息用于标识本条指令所在指令包内的序号,以及作为指令包的起始和结尾标志;
每个所述指令包均包含instinfo、instdepend、instpara信息;
所述instinfo信息用于标识指令包的类型,所述指令包的类型为多种,每种类型的指令包对应由一个独立的执行单元执行,不同类型的指令包由控制模块分发到对应的执行单元;
所述instdepend信息,用于指定指令所需的硬件资源,以及指令间的依赖关系,结合调度策略,确保指令在乱序发射状态下得到正确的执行结果;
所述instpara信息,用于指定指令包的其他参数信息;
指令包的类型包括Load FM、load WT、Cal和Save;
所述的Load FM类型的指令包,用于将卷积运算所需的输入特征图数据由片外空间加载到片内空间;
所述的load WT类型的指令包,用于将卷积运算所需的权重和偏置参数由片外空间加载到片内空间;
所述的Cal类型的指令包,用于进行卷积运算,并将运算结果存储到片内空间;
所述的Save类型的指令包,用于将卷积运算得到的运算结果由片内空间存储到片外空间;
所述硬件资源包括Feature Map资源、Weight资源和Save资源;Feature Map资源用来存储卷积运算所需的输入特征图数据,Weight资源用来存储卷积运算所需的权重和偏置参数,Save资源用来存储卷积运算的结果,每种资源都有ping和pong两份,且ping和pong都有独立的ready信号;
所述的调度策略执行过程如下:
Load FM类型的指令包需要用到Feature Map资源,只有当指令所需资源的ready信号清零时,指令才能够执行,否则阻塞,直到所需资源的ready信号清零;load WT和Save类型的指令包同理,load WT类型的指令包需要用到Weight资源,只有当指令所需资源的ready信号清零时,指令才能够执行,否则阻塞,直到所需资源的ready信号清零;Save类型的指令包需要用到Save资源,只有当指令所需资源的ready信号清零时,指令才能够执行,否则阻塞,直到所需资源的ready信号清零;Cal类型的指令包需要用到上述的Feature Map资源、Weight资源、以及Save资源,只有当指令所需的三种资源的ready信号都被置位时,指令才能够执行,否则阻塞,直到三种资源的ready信号均被置位。
2.根据权利要求1所述的高效的卷积神经网络运算指令集架构构建方法,其特征在于:每个指令包所包含的指令条数是可变的,每个指令包包含的指令条数由该指令包所包含的信息量决定,每条指令占用64Bit内存空间。
3.根据权利要求1所述的高效的卷积神经网络运算指令集架构构建方法,其特征在于:同一类型的指令包由执行单元按顺序执行;
多个执行单元之间可并行执行指令包。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湃方科技(天津)有限责任公司,未经湃方科技(天津)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011352915.0/1.html,转载请声明来源钻瓜专利网。





