[发明专利]用于提高卷积效率的方法、系统和装置在审
| 申请号: | 201880047459.3 | 申请日: | 2018-05-18 |
| 公开(公告)号: | CN111133452A | 公开(公告)日: | 2020-05-08 |
| 发明(设计)人: | S·鲍尔;D·莫洛尼;B·巴里;F·康纳 | 申请(专利权)人: | 莫维迪乌斯有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06K9/62;G06K9/00 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘文灿 |
| 地址: | 爱尔兰*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 提高 卷积 效率 方法 系统 装置 | ||
公开了用于提高卷积神经网络(CNN)加速器的卷积效率的方法、装置、系统和制品。示例装置包括:数据处理元件(DPE)库存引擎,其用于识别被包括在DPE阵列中的平台可用的DPE;模式选择器,其用于确定DPE中的所识别的DPE的卷积布置;DPE配置优化器,其用于基于DPE中的所识别的DPE来确定DPE利用率;以及卷积引擎,其用于当DPE利用率满足DPE利用率门限时,使用所识别的DPE来促进卷积运算。
相关申请
该专利始自要求享有于2017年5月19日提交的序列号为62/508,896的美国临时专利申请的利益的申请。序列号为62/508,896的美国临时专利申请特此通过引用方式全部并入本文。特此要求享有序列号为62/508,896的美国临时专利申请的优先权。
技术领域
概括而言,本公开涉及图像处理,并且更具体而言,涉及用于提高卷积效率的方法、系统和装置。
背景技术
近年来,对图像处理能力的需求已经超出大功率专用桌上型硬件的范围,并且已经成为个人和/或其它移动设备的期望。移动设备通常包括受尺寸约束、温度管理约束和/或电源约束所限制的处理能力。
附图说明
图1示出了使用卷积的示例输入体积和示例输出体积的示例卷积运算。
图2示出了基于“每个输出位置”的示例多通道卷积运算。
图3示出了示例池化操作的示意图。
图4示出了示例全连接操作的示意图。
图5示出了示例卷积神经网络(CNN)加速器的框图。
图6示出了示例数据路径元件(DPE)。
图7是示例系数存储库的图示。
图8是描述用于示例系数存储的示例寻址模型的示例表。
图9是描述基于非FP16格式的示例系数存储库的示例寻址模型的示例表。
图10示出了用于实现本文公开的示例的示例卷积运算。
图11示出了基于示例1*256卷积布置的示例连接复用器的示例操作。
图12示出了基于示例2*128卷积布置的示例连接复用器的示例操作。
图13是用于实现图5的示例CNN加速器的另一示例CNN加速器的示例实施方式的框图。
图14是表示可以被执行以实现图5的CNN加速器和/或图13的CNN加速器来处理与输入图像相关联的图像数据的示例机器可读指令的流程图。
图15是表示可以被执行以实现图5的CNN加速器和/或图13的CNN加速器来执行具有可选池化的卷积运算的示例机器可读指令的流程图。
图16是表示可以被执行以实现图5的CNN加速器和/或图13的CNN加速器来执行重叠池化操作的示例机器可读指令的流程图。
图17是表示可以被执行以实现图5的CNN加速器和/或图13的CNN加速器来执行全连接操作的示例机器可读指令的流程图。
图18是表示可以被执行以实现图5的CNN加速器和/或图13的CNN加速器来配置示例累加器的示例机器可读指令的流程图。
图19是示例处理器平台的框图,所述示例处理器平台被构造为执行图14-18的示例机器可读指令来实现图13的示例CNN加速器。
附图未按比例绘制。通常,在整个附图和所附的书面描述中将使用相同的附图标记来指代相同或相似的部分。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于莫维迪乌斯有限公司,未经莫维迪乌斯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880047459.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:预处理组件和处理工件的方法
- 下一篇:化妆用或皮肤病学的油包水乳液





