[发明专利]运算方法有效
申请号: | 201911406583.7 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111193916B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | H04N9/64 | 分类号: | H04N9/64;H04N9/68 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 方法 | ||
本公开涉及一种运算方法、装置及相关产品,所述产品包括控制模块,所述控制模块包括:指令缓存单元、指令处理单元和存储队列单元;所述指令缓存单元,用于存储所述人工神经网络运算关联的计算指令;所述指令处理单元,用于对所述计算指令解析得到多个运算指令;所述存储队列单元,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型的运算时的运算效率。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种运算方法、装置及相关产品。
背景技术
在人工智能技术领域,深度学习技术目前在图像、视频处理领域已有较为广泛的应用,基于特定的数据集训练完成的神经网络,可以在分类和检测任务中达到较高的准确率。但是,由于受限于训练过程中使用的数据集和预处理工具,训练完成的神经网络通常仅能用在与训练集类型相同/数据格式一致的应用环境下,其可复用性不高。如果需要使用不同类型的输入数据,通常要进行重训练,或对输入数据进行预处理,导致网络预处理时间长,数据处理效率低。
发明内容
有鉴于此,本公开提出了一种运算方法、装置及相关产品,通过根据第一格式和第二格式调整Caffe图像处理模型的模型定义文件,以使根据调整后的模型定义文件生成的Caffe图像处理模型所支持的输入数据格式为第一格式,有效提高了Caffe图像处理模型的匹配度和复用性。
根据本公开的一方面,一种运算方法,其特征在于,所述方法应用于异构计算架构中,所述异构计算架构包括通用处理器和人工智能处理器,包括:
在接收到待处理任务时,判断所述待处理任务的输入图像数据的第一格式与预设的Caffe图像处理模型所支持的输入数据的第二格式是否一致;
在所述第一格式与所述第二格式不一致时,根据所述第一格式及所述第二格式,调整所述Caffe图像处理模型的模型定义文件,以使根据调整后的所述模型定义文件生成的Caffe图像处理模型所支持的输入图像数据为所述第一格式。
在一种可能的实现方式中,所述第一格式和所述第二格式为三基色图像数据格式;
其中,根据所述第一格式及所述第二格式,调整所述模型定义文件,包括:
根据第一格式与所述第二格式的通道个数以及通道顺序,调整所述模型定义文件。
在一种可能的实现方式中,所述第二格式的通道个数少于所述第一格式的通道个数,且所述第一格式的通道顺序与所述第二格式的通道顺序相同;
其中,根据第一格式与所述第二格式的通道个数以及通道顺序,调整所述模型定义文件,包括:
在所述模型定义文件中的首层卷积层对应的卷积核添加卷积核权重为零的卷积通道,以使调整后的所述模型定义文件中的首层卷积层支持所述第一格式的输入图像数据。
在一种可能的实现方式中,所述第二格式的通道个数少于所述第一格式的通道个数,且所述第二格式的通道顺序与所述第一格式的通道顺序不同;
其中,根据第一格式与所述第二格式的通道个数以及通道顺序,调整所述模型定义文件,包括:
调整所述模型定义文件中的首层卷积层对应的卷积核的通道顺序,并在所述首层卷积层对应的卷积核中添加卷积核权重为零的卷积通道,以使修改后的所述首层卷积层支持所述第一格式的输入图像数据。
在一种可能的实现方式中,所述第二格式的通道个数等于所述第一格式的通道个数,且所述第一格式的通道顺序与所述第二格式的通道顺序不同;
其中,根据第一格式与所述第二格式的通道个数以及通道顺序,调整所述模型定义文件,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911406583.7/2.html,转载请声明来源钻瓜专利网。