[发明专利]高性能语音识别协处理器及其协处理的实现方法无效
申请号: | 200810113002.6 | 申请日: | 2008-05-27 |
公开(公告)号: | CN101593520A | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 梁维谦;董明;李鹏;刘志;杨华中 | 申请(专利权)人: | 北京凌声芯语音科技有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/28 |
代理公司: | 北京连和连知识产权代理有限公司 | 代理人: | 张春媛 |
地址: | 100084北京市海淀区上地信息*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 性能 语音 识别 处理器 及其 处理 实现 方法 | ||
技术领域
本发明涉及信息技术领域中超大规模集成电路SOC(System On Chip,片上系统)设计领域,且特别涉及新一代嵌入式语音识别应用领域,具体为一种基于HMM(Hidden Markov Models,隐含马尔可夫模型)的输出概率矩阵运算的高性能语音识别协处理器及其协处理的实现方法。
背景技术
嵌入式语音识别系统的研究一直是语音识别技术应用的重要发展方向。它为移动式、小型化产品提供了良好的人机语音交互,如第三代智能化语言学习机、电话的语音拨号、mp3等娱乐产品的语音检索、车载的语音控制系统、智能玩具和家电语音遥控等。近几年来由于嵌入式MCU(Micro Controller Unit,微控制器)和DSP(Digital Signal Processor,数字信号处理器)处理性能的提高以及语音识别算法的改进;国内外已有嵌入式语音处理SOC(System On Chip,片上系统)实现,而且开始批量应用。但是高性能的语音识别算法是比较复杂的,现有芯片的识别性能,识别算法运算时间,功耗以及成本都不能很好地满足应用的需求。例如实现基于子词隐含马尔可夫模型的中等词表识别任务,对16bit定点DSP(如美国TI公司的TMS320C54x/55x系列)约需100MHz的时钟频率,对32bit的MCU芯片(如ARM9)约需200MHz的时钟频率,这些芯片的功耗大、成本高,难于在便携设备上普遍使用。
而硬件实现语音识别算法的速度很快,参见图1,将语音识别中的关键算法通过大规模集成电路做成语音识别关键运算模块来实现,将该语音识别关键运算模块作为协处理器,例如图1中的高性能语音识别协处理器12,配合主控CPU工作或嵌入主控CPU中,例如通过控制接口13与主控CPU11连接,而且,主控CPU11和高性能语音识别协处理器12可以都与系统总线14连接。这样可以使主控CPU在较低的时钟频率下完成语音识别处理的功能,进而降低功耗和成本。
参见图2,基于HMM的嵌入式语音识别算法包括三个基本步骤:
步骤21,对原始数字语音进行特征提取,得到语音特征矢量。如MFCC(Mel-Frequency Ceptral Coefficients,Mel频率倒谱系数)特征矢量;
步骤22,根据语音特征矢量与声学HMM模型计算输出概率矩阵;
步骤23,利用得到的输出概率矩阵对识别网络进行网络搜索得到最终的识别结果。
其中,计算输出概率矩阵(步骤22)的运算量在中等词表识别任务的条件下将占到整个系统运算量的70%以上。
为达到实时处理语音识别系统,现有技术只能用DSP进行输出概率矩阵的计算。由于DSP是针对通用计算的目标优化的,其针对输出概率矩阵运算不能高效处理,因此,应用大规模集成电路实现输出概率计算协处理器芯片对提高嵌入式语音识别系统的性能至关重要。
发明内容
为了提高基于HMM的语音识别输出概率矩阵计算效率,本发明提供了一种高性能语音识别协处理器及其协处理的实现方法。
本发明首先提供一种高性能语音识别协处理器,包括:存储模块和输出概率计算模块;
上述存储模块与外部处理器相连,用于写入和存储计算过程中的特征矢量,模型状态均值矢量,模型状态协方差矢量,计算得到的概率矩阵;上述存储模块可由一个或多个存储单元组成;
上述输出概率计算模块包括:马氏距离计算模块和对数域加法计算模块;
上述存储模块与上述马氏距离计算模块相连,由上述马氏距离计算模块根据上述特征矢量,模型状态均值矢量,模型状态协方差矢量的数据计算出马氏距离;
上述马氏距离计算模块与上述对数域加法计算模块通过内部数据总线或先进先出存储器相连,上述对数域加法计算模块跟据上述马氏距离计算模块写入的计算结果进行对数域加法计算;
上述对数域加法计算模块与上述存储模块相连,上述对数域加法计算模块计算得到的概率矩阵写入上述存储模块中存储,并输出到外部处理器。
本发明还提供一种高性能语音识别协处理的实现方法,包括:
提供存储模块,将其与外部处理器相连,用于写入和存储计算过程中的特征矢量、模型状态均值矢量、模型状态协方差矢量,计算得到的概率矩阵;
提供输出概率计算模块,包括马氏距离计算模块和对数域加法计算模块;
上述马氏距离计算模块,将其与上述存储模块相连,由上述马氏距离计算模块根据上述特征矢量、模型状态均值矢量、模型状态协方差矢量的数据计算出马氏距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京凌声芯语音科技有限公司,未经北京凌声芯语音科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810113002.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图形排序系统及方法
- 下一篇:基于蓝牙技术的考勤方法、装置和系统