[发明专利]一种用于深度学习的加速装置及计算装置在审
| 申请号: | 201910747408.8 | 申请日: | 2019-08-13 |
| 公开(公告)号: | CN112396153A | 公开(公告)日: | 2021-02-23 |
| 发明(设计)人: | 林伟;张健松;夏立雪;蒋昭;梁昊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 深度 学习 加速 装置 计算 | ||
本申请公开了一种用于深度学习的加速装置和一种用于深度学习的计算装置。其中,所述用于深度学习的加速装置,包括:数据缓冲器,与所述数据缓冲器连接的运算模块;所述数据缓存器用于,缓存所述声码器神经网络的网络层的中间计算结果;所述运算模块用于,根据接收到的控制指令,从所述数据缓存器获得所述声码器神经网络的第一网络层的中间计算结果,将所述第一网络层的中间计算结果发送给所述数据缓存器。采用本申请提供的用于深度学习的加速装置,提高了声码器神经网络的处理效率。
技术领域
本申请涉及电路设计领域,具体涉及一种用于深度学习的加速装置及计算装置。
背景技术
在人工智能应用领域,语音应用占据了相当大的比例。文本至语音转换(TTS,Textto speech)技术作为一种语音应用,在人机交互中经常使用。通常,TTS算法进一步可以分为三个部分:用于将文本预处理为语素等语言学特征的前端,用于将语言学特征变换为声谱、音素等声学特征的后端,以及使用声学特征生成最终语音的声码器。在这三个部分中,由于声码器的输出频率等于音频信号的采样频率,即16~22kHz,因此声码器的计算量、访存量大,一直是TTS计算流程中制约计算速度的瓶颈。
当前生成语音质量最好的TTS算法均基于神经网络模型,相对于传统的基于隐马尔科夫模型(HMM,Hidden Markov Model)等现有技术方案,基于神经网络方法的语音合成效果更接近与人类的实际语音效果。WaveNet是当前语音生成质量最好的声码器,被广泛用在多种基于神经网络的TTS算法中。
Wavenet是完全基于迭代的,即生成下一帧语音的运算需要等待上一帧的语音输出结果后才能开始。人类语音的频率范围大约在20kHz,这就意味着生成1秒语音需要将整个神经网络循环迭代几万轮。常见的硬件加速结构基于单指令多数据流(SIMD,SingleInstruction Multiple Data),因而对这种迭代式网络的加速效果十分有限,需要处理几十至上百秒才能生成长度1秒的语音,完全不能满足实时性的语音生成产品的实际需要。
如何以简单的硬件结构完成Wavenet等声码器神经网络的所有算子,避免声码器神经网络每秒数万次的片外交互,降低计算延迟,从而提高声码器神经网络的处理效率成为亟待解决的问题。
发明内容
本申请提供一种用于深度学习的加速装置,以提高声码器神经网络的处理效率。
所述加速装置,包括:数据缓冲器,与所述数据缓冲器连接的运算模块;
所述数据缓存器用于,缓存声码器神经网络的网络层的中间计算结果;
所述运算模块用于,根据接收到的控制指令,从所述数据缓存器获得声码器神经网络的第一网络层的中间计算结果,,将所述第一网络层的中间计算结果发送给所述数据缓存器。
可选的,所述应用于声码器神经网络的加速装置,还包括控制器;
所述控制器用于向所述运算单元发送所述控制指令。
可选的,所述根据接收到的控制指令,从所述数据缓存器获得所述声码器神经网络的第一网络层的中间计算结果,将所述第一网络层的中间计算结果发送给所述数据缓存器,包括:根据接收到的控制指令,从所述数据缓存器获得所述声码器神经网络的第一网络层的中间计算结果;
根据所述第一网络层的中间计算结果,获得与所述第一网络层级联的第二网络层的中间计算结果;
将所述第二网络层的中间计算结果发送给所述数据缓存器。
可选的,所述运算模块包括:矩阵运算单元,与所述矩阵运算单元连接的加法单元,与所述加法单元连接的激活单元,与激活单元连接的乘法单元,与所述乘法单元连接的偏差单元;
所述矩阵运算单元用于,针对所述第一网络层的中间计算结果执行乘累加运算,获得乘累加数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910747408.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种振动锤用圆桩抱臂组件
- 下一篇:光学镜头、摄像头模组和终端





