[发明专利]非特定人的嵌入式中英文混合语音识别方法及系统有效
申请号: | 200910157598.4 | 申请日: | 2009-07-16 |
公开(公告)号: | CN101604522A | 公开(公告)日: | 2009-12-16 |
发明(设计)人: | 王辉 | 申请(专利权)人: | 北京森博克智能科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100094北京市海淀区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特定 嵌入式 中英文 混合 语音 识别 方法 系统 | ||
技术领域
本发明涉及自动语音识别技术领域,是一种非特定人的、面向计算和存储资源有限的嵌入式应用环境、支持中英文混合语言的语音识别方法及系统。
背景技术
语音是人类沟通和获取信息最自然、最便捷的方式。智能语音交互技术主要包括语音识别技术、语音合成技术、语音评测技术等,智能语音交互将是继图形交互模式(GUI)之后人机交互模式上具有突破性意义的变革。
语音识别技术是让机器听懂人说话,通过机器自动将语音信号转化为文本及相关信息的技术,是智能语音交互技术中非常重要的、也是非常关键的部分。从语音识别技术发展的情况看,其应用主要向以下两个方向发展:一个是大词汇量连续语音识别系统,主要应用于听写机、语音信息查询服务系统、海量音频数据自动标注系统等,这些系统都运行在PC平台或服务器上;另一个是嵌入式语音识别系统,面向小型化、便携式的、嵌入式的产品应用,如手机上的语音拨号、车载设备的语音控制、智能语音玩具、家电遥控等,这些嵌入式应用系统大都使用专门的硬件系统实现,如MCU、DSP和语音识别专用芯片,其运算速度、存储容量都非常有限。同时,它这些嵌入式应用系统还要求识别是实时的,并具有体积小、可靠性高、耗电少、成本低等特点。嵌入式语音产品的这些应用特点以及嵌入式系统资源的有限性是目前语音识别技术嵌入式应用的难点。
现有的嵌入式语音识别系统主要还是特定人孤立词语音识别,即需要用户在使用前让系统对所识别的词条先进行学习或训练。这一类识别功能对语种、方言没有限制,识别率很高,但使用前的录音和训练很不方便。
有一些嵌入式语音识别系统能实现非特定人语音识别,即预先将所要识别的语音模型训练好并装入系统的存储器,用户使用时不需要再进行学习而直接使用。但这类识别功能只适用于特定的语种和方言,识别率比特定人系统低,还有待进一步提高。
21世纪全球大融合的趋势越来越明显,甚至不同语种语言之间的融合特征也越来越多。在中国,外来英语词汇越来越多,一个人同时有中英文名字的情况越来越多,现实社会中越来越多的应用环境和产品系统中出现了中英文混用的情况。在这样的情况下,目前单一语种的中文语音识别技术无法实现中英文混合的语音识别,中英文混合识别是未来的中文语音识别技术发展的趋势。
结合语音识别技术的发展趋势,针对嵌入式系统语音识别应用的特点,以及目前中英文混用的应用特点,本发明采用全新的语音识别理念和框架,实现了一种非特定人的,面向嵌入式应用的,支持中英文混合识别的语音识别系统,该系统可广泛应用于各种小型化的嵌入式电子产品和嵌入式系统中,实现高识别率的、中英文混合语音识别。
发明内容
本发明克服现有语音识别技术的不足,实现了一种高识别率、非特定人、支持中英文混合的嵌入式语音识别方法及系统,使其能够应用于各种嵌入式应用领域,实现实时的语音识别,且在中等词汇量上识别率达95%以上。本发明算法压力小,存储空间小,适合在各种主流硬件环境中实时运行。
本发明是通过以下技术方案实现的,主要由S1-声学模型训练、S2-词树生成、S3-前端处理、S4-识别解码四个部分组成,如图1所示。
以下是对本发明进一步的说明:
S1-声学模型训练
特征提取:按帧长25毫秒,帧移10毫秒提取12维MFCC特征,再加上1维能量特征,共13维静态特征。动态特征取一阶和二阶差分特征,得到39维的声学特征向量序列。
兼容中文和英文发音方式的声学建模单元集,基于海量语音数据训练的声学模型,使得该语音识别方法是非特定人的、并支持中英文语言混合识别。具体是在英文音素集的基础上,扩展了英文中没有的中文发音单元,再加上静音单元构成。
基本声学模型的训练:声学建模方法使用CDHMM+GMM,利用本领域熟知的方法训练状态绑定的上下文相关三音子模型,并得到与每个GMM模型的每个混合项绑定的特征集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京森博克智能科技有限公司,未经北京森博克智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910157598.4/2.html,转载请声明来源钻瓜专利网。