[发明专利]确定最优计算模板的方法和装置有效
申请号: | 201911232364.1 | 申请日: | 2019-12-05 |
公开(公告)号: | CN112926168B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 陈良;叶挺群 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F8/41;G06N3/0464;G06V10/82 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李珂珂 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 最优 计算 模板 方法 装置 | ||
1.一种图像识别方法,其特征在于,所述方法包括:
获取目标计算层对应的模板参数;其中,所述目标计算层为神经网络中的任一计算层,所述模板参数包括线程块尺寸、是否展开循环、循环执行顺序;
基于所述模板参数的不同取值,确定所述目标计算层对应的各种计算模板;
在所述各种计算模板中,确定满足与本设备对应的预设硬件限制条件的目标计算模板;
基于每种目标计算模板,对所述目标计算层的张量算式进行编译和模拟运行,并确定每种目标计算模板的运行时间;
将运行时间最小的目标计算模板,确定为最优计算模板;
基于所述最优计算模板,对所述张量算式进行编译,生成最优计算指令;
将待识别图像输入所述神经网络,通过运行所述神经网络中每个计算层对应的最优计算指令,对所述待识别图像进行识别。
2.根据权利要求1所述的方法,其特征在于,所述预设硬件限制条件包括:计算模板中线程块尺寸的取值对应的线程数小于或等于预设的线程数上限。
3.根据权利要求1所述的方法,其特征在于,所述预设硬件限制条件还包括:计算模板中线程块尺寸的取值对应的存储空间容量小于或等于预设的存储空间容量上限。
4.根据权利要求1所述的方法,其特征在于,所述基于每种目标计算模板,对所述目标计算层的张量算式进行编译和模拟运行,并确定每种目标计算模板的运行时间,包括:
对于每种目标计算模板,基于所述目标计算模板,对所述张量算式进行编译,生成所述张量算式的程序代码,获取所述张量算式中各未知参数的模拟运行数据,基于所述各未知参数的模拟运行数据,运行所述程序代码,确定所述目标计算模板对应的运行时间。
5.一种图像识别装置,其特征在于,所述装置包括:
计算模板确定模块,用于获取目标计算层对应的模板参数;基于所述模板参数的不同取值,确定所述目标计算层对应的各种计算模板;其中,所述目标计算层为神经网络中的任一计算层,所述模板参数包括线程块尺寸、是否展开循环、循环执行顺序;
目标计算模板确定模块,用于在所述各种计算模板中,确定满足与本设备对应的预设硬件限制条件的目标计算模板;
运行时间确定模块,用于基于每种目标计算模板,对所述目标计算层的张量算式进行编译和模拟运行,并确定每种目标计算模板的运行时间;
最优计算模板确定模块,用于将运行时间最小的目标计算模板,确定为最优计算模板;
生成模块,用于基于所述最优计算模板,对所述张量算式进行编译,生成最优计算指令;
处理模块,用于将待识别图像输入所述神经网络,通过运行所述神经网络中每个计算层对应的最优计算指令,对所述待识别图像进行识别。
6.根据权利要求5所述的装置,其特征在于,所述预设硬件限制条件包括:计算模板中线程块尺寸的取值对应的线程数小于或等于预设的线程数上限。
7.根据权利要求5所述的装置,其特征在于,所述预设硬件限制条件还包括:计算模板中线程块尺寸的取值对应的存储空间容量小于或等于预设的存储空间容量上限。
8.根据权利要求5所述的装置,其特征在于,所述运行时间确定模块,还用于:
对于每种目标计算模板,基于所述目标计算模板,对所述张量算式进行编译,生成所述张量算式的程序代码,获取所述张量算式中各未知参数的模拟运行数据,基于所述各未知参数的模拟运行数据,运行所述程序代码,确定所述目标计算模板对应的运行时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911232364.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种甲醇制取芳烃化合物的方法
- 下一篇:一种高速公路路况监测预警装置