[发明专利]神经网络加速器、数据处理装置及神经网络加速方法在审
| 申请号: | 202111020115.3 | 申请日: | 2021-09-01 |
| 公开(公告)号: | CN113780541A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 祝叶华;孙炜 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 吴薇薇;张颖玲 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 加速器 数据处理 装置 加速 方法 | ||
本申请提供一种神经网络加速器,包括第一处理单元和第二处理单元;所述第一处理单元中的第一数据中转模块与所述第二处理单元中的第二数据中转模块连接;所述第一处理单元通过所述第一数据中转模块,向所述第二数据中转模块发送第一目标数据,和/或,所述第一处理单元通过所述第一数据中转模块接收所述第二数据中转模块发送的第二目标数据。本申请还提供一种数据处理装置和神经网络加速方法。
技术领域
本申请涉及电子技术领域,尤其涉及一种神经网络加速器、数据处理装置及神经网络加速方法。
背景技术
深度学习算法因其优越性能而在计算机视觉、语音识别、自然语言处理、生物信息学等领域中获得广泛应用。用于深度学习计算的神经网络加速器可以对诸如图像数据的数据集进行处理,得到用户感兴趣的信息,例如人脸识别、入侵检测,活物检测,方向检测,对象分类,行为计数等。
目前,用于深度学习计算的神经网络加速器采用分布式存储模式,虽然具有较高的处理并行度的优势,但是采用分布式存储模式会限制深度学习算法实现的灵活性。
发明内容
本申请实施例提供一种神经网络加速器、数据处理装置及神经网络加速方法。
本申请的技术方案是这样实现的:
本申请提供一种神经网络加速器,包括:第一处理单元和第二处理单元;
所述第一处理单元中的第一数据中转模块与所述第二处理单元中的第二数据中转模块连接;
所述第一处理单元通过所述第一数据中转模块,向所述第二数据中转模块发送第一目标数据,和/或,所述第一处理单元通过所述第一数据中转模块接收所述第二数据中转模块发送的第二目标数据。
可选地,所述第一处理单元还包括第一数据存储模块和第一数据处理模块;
所述第一数据中转模块分别与所述第一数据处理模块和所述第一数据存储模块连接;
所述第一数据存储模块,用于存储待处理数据;
所述第一数据处理模块,用于对所述待处理数据进行处理,得到处理结果。
可选地,所述第一数据中转模块包括转发子模块;
所述转发子模块分别与所述第一数据存储模块、所述第一数据处理模块、以及所述第二数据中转模块连接;
所述转发子模块,用于读取所述处理结果和/或所述待处理数据;将所述处理结果和/或所述待处理数据作为所述第一目标数据发送给所述第二数据中转模块。
可选地,所述第一数据中转模块包括运算子模块和转发子模块;
所述运算子模块分别与所述第一数据存储模块、所述第一数据处理模块、以及所述转发子模块连接;
所述转发子模块还与所述第二数据中转模块连接;
所述运算子模块用于对所述处理结果和/或所述待处理数据进行运算处理,得到第一运算结果;
所述转发子模块用于将所述第一运算结果作为所述第一目标数据发送给所述第二数据中转模块。
可选地,所述转发子模块还用于接收所述第二数据中转模块发送的所述第二目标数据;
所述运算子模块,还用于对所述第二目标数据、所述待处理数据、所述处理结果中的至少一项进行运算处理,得到第二运算结果。
可选地,所述神经网络加速器还包括第三处理单元;
所述第三处理单元的第三数据中转模块与所述转发子模块连接;
所述转发子模块,还用于向所述第三数据中转模块发送所述第二运算结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111020115.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种粉末腔流化结构
- 下一篇:一种建筑工程用废料回收再利用设备





