[发明专利]基于图像处理的Depthwise快速卷积系统及图像识别方法在审
| 申请号: | 202010035427.0 | 申请日: | 2020-01-14 |
| 公开(公告)号: | CN111260598A | 公开(公告)日: | 2020-06-09 |
| 发明(设计)人: | 李钢;周欢欢;张旸 | 申请(专利权)人: | 中国科学院自动化研究所南京人工智能芯片创新研究院 |
| 主分类号: | G06T5/50 | 分类号: | G06T5/50;G06N3/04 |
| 代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 窦贤宇 |
| 地址: | 211000 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图像 处理 depthwise 快速 卷积 系统 识别 方法 | ||
1.一种基于图像处理的Depthwise快速卷积系统,其特征在于,包括图像像素读取单元和DW卷积计算单元,通过以行作为数据单位与卷积核进行运算实现图像卷积,可以减少重复读取存储单元的过程;
图像像素读取单元,以H、W和D三个维度对图像中每一组像素进行标注,将待处理的图像存储到存储单元中,根据计算并行度先考虑D维度,再H维度,最后是W维度;
DW卷积计算单元,按行对图像数据进行读取后,每一行图像数据都要与三行的卷积核进行乘累加计算,直至完成所有图像数据行的计算,最终通过像素与对应卷积核乘积的累加得到最终的卷积结果。
2.根据权利要求1所述的一种基于图像处理的Depthwise快速卷积系统,其特征在于,所述DW卷积计算单元将待处理的图像数据获取之后,按行与三层卷积核分别进行乘累加运算,具体步骤为:
步骤1、选取卷积核,在W维度和H维度组成的平面上从地址1开始取3*3的像素组作为Weight层;
步骤2、完成图像数据组的第一行与三层卷积核数据组的计算;
步骤21、由于卷积核是3*3的组成,所以一次进行三个图像数据与三个卷积核数据的对应计算,以此类推,第一行数据与第一行卷积核数据计算后得出数据组为DW00,具体为:p1*w1+p2*w2+p3*w3,p2*w1+p3*w2+p4*w3,p3*w1+p4*w2+p5*w3······直到完成该行每一个数据乘累加运算;
步骤22、进行第一行数据与第二行卷积核数据的计算,得出数据组为DW01,具体为:p1*w9+p2*w10+p3*w11,p2*w9+p3*w10+p4*w11,p3*w9+p4*w10+p5*w11······直到完成该行每一个数据乘累加运算;
步骤23、进行第一行数据与第三行卷积核数据的计算,得出DW02,具体为:p1*w17+p2*w18+p3*w19,p2*w17+p3*w18+p4*w19,p3*w17+p4*w18+p5*w19······直到完成该行每一个数据乘累加运算;
其中,p1为图像数据组的第一个数据,p2为图像数据组的第二个数据, p3为图像数据组的第三个数据,p4为图像数据组的第四个数据, p5为图像数据组的第五个数据,w1、w2、w3、w9、w10、w11、w17、w18、w19分别是卷积核数据组的9个数据;
步骤3、仿照步骤2,继续完成图像数据组其余行与卷积核的乘累加过程,直至图像数据组的所有数据均参与过运算;
步骤4、为了保证图像数据组的9个像素与卷积核的9个参数对应的乘积可以进行累加,在每行图像数据组的数据与卷积核的三行计算结果得出后,下一行计算得出的结果在累加时,整体移位,以同上一行的计算结果相对应,从而得到最终的卷积结果。
3.根据权利要求1所述的一种基于图像处理的Depthwise快速卷积系统,其特征在于,所述DW卷积计算单元需要两个缓冲存储区进行数据暂存、计算和结果输出,具体计算过程为:
步骤1、输入两块存储区,Buffer A和Buffer B;
步骤2、通过做乘积的累加获得卷积结果;
步骤21、使用缓冲存储区Buffer B写入DW00的数据;
步骤22、使用Buffer A写入DW10的数据;同时,读取Buffer B中的DW00后,与DW11相加后写入Buffer B中;
步骤23、读取Buffer B中存储的DW00+DW11,加上当前行计算结果DW22后,输出第一个卷积计算结果;往Buffer B中继续存储计算结果DW20;与此同时,读取Buffer A中的DW10,加上当前计算结果DW21后写回Buffer A中;
步骤3、交替以计算第二行和第三行的计算存储方式,计算出所有行的卷积计算结果。
4.根据权利要求1所述的一种基于图像处理的Depthwise快速卷积系统,其特征在于,所述DW卷积计算单元提高了图像存储和计算的利用率,减少了对像素组数据读取的重复率,减轻了图像卷积的资源消耗。
5.一种快速图像识别方法,其特征在于,在需要快速进行图像处理的场景中,为了减轻机器学习或者神经网络计算的工作量,快速完成图像识别的要求,得到较好的图像处理结果,使用权利要求1至4任一项所述的Depthwise快速卷积系统对图像数据进行快速存储,具体步骤为:
步骤1、判断使用场景对图像卷积的质量和速度的要求,确认符合快速处理的场景设定;
步骤2、使用Depthwise快速卷积系统对图像数据进行快速存储;
步骤3、进一步反复读取图像像素完成图像卷积和进一步的图像处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所南京人工智能芯片创新研究院,未经中国科学院自动化研究所南京人工智能芯片创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010035427.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





