[发明专利]一种基于光电计算阵列的深度残差网络的加速方法有效
申请号: | 201910291717.9 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110009102B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王瑶;娄胜;王宇宣 | 申请(专利权)人: | 南京吉相传感成像技术研究院有限公司 |
主分类号: | G06N3/067 | 分类号: | G06N3/067;G06N3/0464 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 211135 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 光电 计算 阵列 深度 网络 加速 方法 | ||
本发明公开了一种基于光电计算阵列的深度残差网络的加速方法。其中,光电计算阵列包括由多个发光单元周期排列组成的发光阵列和由多个计算单元周期排列组成的计算阵列。加速方法包括如下步骤:发光阵列将深度残差网络的权重通过光输入的方法输入到计算阵列中,作为光输入量,并保存在计算阵列中;将图像数据量化为单比特的数据后输入到计算阵列中,作为电输入量;利用计算阵列分别对深度残差网络的卷积层、全连接层和残差学习单元中的运算进行计算,计算完成后输出数字信号,再对该数字信号进行移位累加操作,得到最终结果。本发明的加速方法在较大提高运算速度的同时具备高能效的特点。
技术领域
本发明涉及一种利用光电计算阵列对深度残差网络进行加速的方法,属于光学领域和图像识别等机器学习领域。
背景技术
传统的计算机大多采取冯诺依曼架构,然而,由于冯诺依曼架构存储单元和运算单元的分立,导致了在数据传输上产生了极大的能量消耗,并且影响运算速度。
传统的神经网络的训练因为其层次加深而变得困难,梯度消失和梯度爆炸让传统神经网络的精度大大损失,仅靠数据初始化和正则化虽然能解决这个问题,但是却带来了网络性能退化的问题。而深度残差网络可以轻松的对层次较深的神经网络进行训练,不仅解决了梯度问题和退化问题,更使得网络的性能随深度的提升而提升。
目前利用数字电路对深度残差网络进行加速的一般方法,是将卷积运算展开为矩阵向量乘法运算,并使用相应的乘累加单元完成矩阵乘法运算。但是,单个乘法器需要较大的资源(面积),也带来较高的功耗;并且存储墙的存在也限制了运算速度的进一步提升。
发明内容
本发明提出一种基于光电计算阵列的深度残差网络的加速方法,该加速方法在较大提高运算速度的同时具备高能效的特点。
本发明采用的技术方案如下:
一种基于光电计算阵列的深度残差网络的加速方法,其光电计算阵列包括由多个发光单元周期排列组成的发光阵列和由多个计算单元周期排列组成的计算阵列;所述加速方法包括如下步骤:发光阵列将深度残差网络的权重通过光输入的方法输入到计算阵列中,作为光输入量,并保存在计算阵列中;将图像数据量化为单比特的数据后输入到计算阵列中,作为电输入量;利用计算阵列分别对深度残差网络的卷积层、全连接层和残差学习单元中的运算进行计算,计算完成后输出数字信号,再对该数字信号进行移位累加操作,得到最终结果。
进一步地,所述计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区;所述载流子控制区用于控制并调制光生载流子收集区和读出区内的载流子;所述光生载流子收集区和读出区中的收集区用于吸收发光单元发射的光子并收集产生的光生载流子;所述载流子控制区或者光生载流子收集区和读出区中的读出区与电信号连接,读出区用于输出被所述光生载流子和所述电信号作用后的载流子;所述耦合区连接收集区和读出区。
进一步地,利用计算阵列对深度残差网络的卷积层中的卷积运算进行计算,每一层卷积层的计算过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京吉相传感成像技术研究院有限公司,未经南京吉相传感成像技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910291717.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成量化神经网络的方法和装置
- 下一篇:一种深度学习卷积计算的方法和装置