[发明专利]应用于稀疏神经网络的处理器和处理方法在审
| 申请号: | 201710733524.5 | 申请日: | 2017-08-24 |
| 公开(公告)号: | CN107527090A | 公开(公告)日: | 2017-12-29 |
| 发明(设计)人: | 韩银和;许浩博;王颖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06N5/04 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇,李科 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 应用于 稀疏 神经网络 处理器 处理 方法 | ||
技术领域
本发明涉及人工智能技术领域,尤其涉及一种应用于稀疏神经网络的处理器和处理方法。
背景技术
人工智能技术在近些年来得到了迅猛的发展,在全世界范围内得到了广泛的关注,无论是工业界还是学术界都开展了人工智能技术的研究工作,目前,人工智能技术已经渗透至视觉感知、语音识别、辅助驾驶、智能家居、交通调度等各个领域。
深度学习技术是人工智能技术发展的助推器,深度学习采用深度神经网络的拓扑结构进行训练、优化及推理等,深度神经网络包括卷积神经网络、深度置信网络、循环神经网络等。以图像识别应用为例,经过反复训练、迭代,深度学习算法通过深度神经网络可以自动地获得隐藏的图像的特征数据,并且产生优于传统的基于模式识别分析方法的效果。
然而,实现深度学习技术依赖于极大的计算量。在训练阶段,需要在海量数据中通过反复迭代计算得到神经网络中的权重数据;在推理阶段,同样需要神经网络在极短的响应时间(通常为毫秒级)内完成对输入数据的运算处理,这需要所部署的神经网络运算电路(包括CPU、GPU、FPGA和ASIC等)达到每秒千亿次甚至万亿次的计算能力。随着神经网络运算电路的规模越来越大、数据吞吐量越来越高,运行功耗成为一个严重问题。
因此,神经网络处理器如何在保证高性能的同时保证高能效,是目前亟待解决的技术问题。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种应用于稀疏神经网络的处理器及处理方法。
根据本发明的第一方面,提供了一种应用于稀疏神经网络的处理器。该处理器包括:存储单元,其用于存储数据和指令;控制单元,其用于获得保存在所述存储单元的指令并发出控制信号;计算单元,其用于从所述存储单元获得神经网络中的一层的节点值和对应的权重值数据以获得下一层的节点值,其中,当待计算元素中任一项等于零时,计算单元不执行该计算元素的乘法运算,其中,所述待计算元素包括节点值和权重值。
在本发明的一个实施例中,所述计算单元包括:
乘法单元,用于完成节点值和权重值的乘法操作;
加法单元,用于对乘法单元的计算结果进行累加;
零值判断单元,其通过反相器接入到所述乘法单元,当所述计算元素中存在零值时,该零值判断单元输出第一控制信号以指示所述乘法单元不执行该计算元素的乘法操作,当所述计算元素中不存在零值时,该零值判断单元输出第二控制信号以指示所述乘法单元执行该计算元素的乘法操作。
在本发明的一个实施例中,所述计算单元还包括:
数据选择器,其控制端与所述零值判断单元的输出相连接,第一输入端接入零值,第二输入端接入所述乘法单元的输出,当该数据选择器接收到所述第一控制信号时,选择将所述第一输入端的零值接入到所述加法单元,当该数据选择器接收到所述第二控制信号时,选择将所述乘法单元的输出接入至所述加法单元。
在本发明的一个实施例中,所述数据选择器是二选一的数据选择器。
在本发明的一个实施例中,所述第一控制信号是“1”,所述第二控制信号是“0”。
在本发明的一个实施例中,所述反相器为非门。
在本发明的一个实施例中,所述零值判断单元包括用于判断节点值是否为零的第一判断单元和用于判断权重值是否为零的第二判断单元,所述第一判断单元和所述第二判断单元的输出接入至或门的输入,所述或门的输出作为所述零值判断单元的输出。
在本发明的一个实施例中,所述第一判断单元是比较器,其两个输入端分别接入节点值和零值,当节点值等于零值时,所述第一判断单元输出1,否则,输出0;所述第二判断单元是比较器,其两个输入端分别接入权重值和零值,当权重值等于零时,所述第二判断单元输出1,否则,输出0。
根据本发明的第二方面,提供了一种应用于稀疏神经网络的处理方法。该方法包括:获得神经网络中的一层的节点值和对应的权重值数据;对所述一层的节点值和对应的权重值执行卷积操作以获得下一层的节点值,其中,在所述卷积操作中,当节点值或对应的权重值中任一项等于零时,不执行对该节点值和其对应的权重值的乘法操作。
在本发明的一个实施例中,通过执行以下操作获得下一层的节点值:当待计算元素中一层的节点值和对应的权重值任一项为零时,将零值接传送到加法器;以及当待计算元素中一层的节点值和对应的权重值均不为零时,将该一层的节点值和对应的权重值相乘之后获得的数值传送至加法器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710733524.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光固化快速成型机
- 下一篇:3D打印机





