[发明专利]基于FLASH存算阵列的脉冲型卷积神经网络有效
申请号: | 201910741894.2 | 申请日: | 2019-08-12 |
公开(公告)号: | CN110543933B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 黄鹏;项亚臣;康晋锋;刘晓彦;韩润泽 | 申请(专利权)人: | 北京大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 flash 阵列 脉冲 卷积 神经网络 | ||
本公开提供了一种基于FLASH存算阵列的脉冲型卷积神经网络,包括:采样模块、基于FLASH的存算阵列及其对应的神经元模块、以及计数器模块;所述采样模块用于对输入图像进行采样,得到输入脉冲;所述基于FLASH的存算阵列存储有权重矩阵,其对输入脉冲与权重矩阵进行向量矩阵乘法运算,运算结果以电流形式输出;所述神经元模块对基于FLASH的存算阵列的运算结果进行积分,生成输出脉冲;所述计数器模块统计输出层的神经元模块产生的脉冲数量,将具有最大脉冲数量的神经元模块的脉冲数量作为识别结果。
技术领域
本发明属于半导体器件及集成电路领域,具体是一种基于FLASH存算阵列的脉冲型卷积神经网络。
背景技术
深度学习在图像处理和语音识别等方面取得了巨大成功,并被广泛应用于自动驾驶、安防监控等领域。作为深度学习重要组成部分的卷积神经网络,其性能的提升对深度学习的进一步发展具有重要意义。基于FLASH设计的存储计算一体化阵列(存算阵列)能够并行执行矩阵向量乘法运算,实现存算一体化,从而在硬件层面对运算进行加速。但是类似的存算一体化结构会引入新的问题,即外围电路尤其是模数/数模转换器带来的额外且巨大的硬件开销。
发明内容
(一)要解决的技术问题
本公开提出了一种基于FLASH存算阵列的脉冲型卷积神经网络,主要解决了以下技术问题:(1)存储计算一体化;(2)基于FLASH存算阵列的脉冲型卷积神经网络硬件实现。
(二)技术方案
本公开提供了一种基于FLASH存算阵列的脉冲型卷积神经网络,包括:采样模块、基于FLASH的存算阵列及其对应的神经元模块、以及计数器模块;
所述采样模块用于对输入图像进行采样,得到输入脉冲;
所述基于FLASH的存算阵列存储有权重矩阵,其对输入脉冲与权重矩阵进行向量矩阵乘法运算,运算结果以电流形式输出;
所述神经元模块对基于FLASH的存算阵列的运算结果进行积分,生成输出脉冲;
所述计数器模块统计输出层的神经元模块产生的脉冲数量,将具有最大脉冲数量的神经元模块的脉冲数量作为识别结果。
在本发明的实施例中,所述采样模块利用泊松采样或高斯采样对输入图像进行采样,得到输入脉冲。
在本发明的实施例中,所述脉冲型卷积神经网络的每一层均包括:所述基于FLASH的存算阵列,所述基于FLASH的存算阵列包括:多个FLASH单元、多条字线、多条源线、多条位线、多个减法器;
多个FLASH单元组成的存算阵列,每一列FLASH单元的栅极连接相同的字线,源极连接相同的源线,每一行FLASH单元的漏极连接相同的位线;每个减法器的正极端和负极端分别连接相邻两条位线。
在本发明的实施例中,
所述字线的数量对应于所述存算阵列的列数,输入脉冲通过字线输入FLASH单元;
所述源线的数量对应于所述存算阵列的列数,所述源线均接固定的驱动电压;
所述位线的数量对应于所述存算阵列的行数,每一行位线叠加该行各列FLASH单元的漏极信号,并将叠加的漏极信号作为输出信号输出。
在本发明的实施例中,所述FLASH单元存储有卷积神经网络的权重值,所述基于FLASH的存算阵列存储卷积神经网络的权重矩阵。
在本发明的实施例中,对所述FLASH单元编程,所述FLASH单元的存储状态视为“0”;对所述FLASH单元擦除,所述FLASH单元的存储状态视为“1”。
在本发明的实施例中,所述减法器正极端连接的位线上的FLASH单元存储正权重值,其负极端连接的位线上的FLASH单元存储负权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910741894.2/2.html,转载请声明来源钻瓜专利网。