[发明专利]声学模型优化方法、装置及语音唤醒方法、装置和终端有效
| 申请号: | 201310603784.2 | 申请日: | 2013-11-25 |
| 公开(公告)号: | CN103632667B | 公开(公告)日: | 2017-08-04 |
| 发明(设计)人: | 郑伟军;王青;王细勇 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/10 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙)44285 | 代理人: | 唐华明 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声学 模型 优化 方法 装置 语音 唤醒 终端 | ||
技术领域
本发明涉及语音识别技术领域,更具体地说,涉及一种声学模型优化方法、装置及语音唤醒方法、装置和终端。
背景技术
目前用户使用语音进行交互的习惯正在形成,在当前的语音交互过程中,用户需要先点亮终端设备的屏幕、解除锁屏、寻找和启动终端设备安装的语音软件才可使用语音进行交互,这种语音交互过程并没有完全释放双手。语音唤醒技术正好可以解决这个问题,语音唤醒技术可在手机锁屏状态下唤醒手机,自动启动语音软件,能给用户带来更好的语音交互体验。
语音唤醒技术涉及到对用户语音的识别,为了提高语音唤醒的准确率,必须设法降低语音识别的误识别率和提高语音识别的准确率,声学模型作为语音识别系统的最为重要的部分,在降低语音识别的误识别率和提高语音识别的准确率方面具有重要的作用。
本发明的发明人在实现本发明的过程中发现:目前在进行语音识别时,均是采用针对所有人的通用声学模型进行语音的识别,由于通用声学模型与特定用户并无法自适应,因此无论特定用户使用多少次语音,使用了多长时间的语音,在对降低特定用户的语音识别的误识别率,和提高特定用户的语音识别的准确率方面,现有通用声学模型均没有帮助。
发明内容
有鉴于此,本发明实施例提供一种声学模型优化方法、装置及语音唤醒方法、装置和终端,以解决现有声学模型与特定用户并无法自适应,对降低特定用户的语音识别的误识别率,和提高特定用户的语音识别的准确率方面没有帮助的问题。
为实现上述目的,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供一种声学模型优化方法,所述方法包括:
接收语音信号,提取所述语音信号的声学特征参数;
判断所述声学特征参数是否与设定用户相对应;
在所述声学特征参数与设定用户相对应时,使用所述声学特征参数对当前声学模型的统计参数进行修正,以对当前声学模型进行优化。
结合第一方面,在第一方面的第一种可能的实现方式中,所述判断所述声学特征参数是否与设定用户相对应包括:
通过所述声学特征参数、预先注册的设定用户的声纹,及声纹模型计算似然概率,若所述似然概率在预定值范围内,则确定所述声学特征参数与设定用户相对应,若所述似然概率不在预定值范围内,则确定所述声学特征参数与设定用户不对应。
结合第一方面,在第一方面的第二种可能的实现方式中,所述使用所述声学特征参数对当前声学模型的统计参数进行修正包括:
利用当前声学模型对所述声学特征参数进行音素串识别;
将所识别的音素串中的各音素进行状态级切分,将一个音素分成若干个状态;
利用各音素的每个状态所对应的声学特征参数,对当前声学模型中对应音素的状态的统计参数进行修正。
结合第一方面的第二种可能的实现方式,在第三种可能实现方式中,所述利用当前声学模型对所述声学特征参数进行音素串识别包括:
计算所述声学特征参数,与当前声学模型中的每个音素的特征参数的统计参数的似然概率,得到概率最大的音素串,所述概率最大的音素串为所识别出的音素串。
结合第一方面的第二种可能的实现方式,或第三种可能实现方式,在第四种可能实现方式中,所述利用各音素的每个状态所对应的声学特征参数,对当前声学模型中对应音素的状态的统计参数进行修正包括:
计算各音素的每个状态所对应的声学特征参数,和当前声学模型中对应音素的状态的统计参数的似然概率;
根据所述似然概率计算更新因子,使用所述更新因子调整当前声学模型中对应音素的状态的统计参数,使得统计参数和对应声学特征参数的差值减小;
将调整后的当前声学模型中对应音素的状态的统计参数,确定为声学模型的模型参数。
第二方面,本发明实施例提供一种声学模型优化装置,所述装置包括:
第一接收模块,用于接收语音信号;
第一提取模块,用于提取所述语音信号的声学特征参数;
第一判断模块,用于判断所述声学特征参数是否与设定用户相对应;
第一修正模块,用于在所述第一判断模块的判断结果为是时,使用所述声学特征参数对当前声学模型的统计参数进行修正,以对当前声学模型进行优化。
第三方面,本发明实施例提供一种终端,包括上述所述的声学模型优化装置。
第四方面,本发明实施例提供一种语音唤醒方法,应用于终端设备,所述方法包括:
接收语音信号,提取所述语音信号的声学特征参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310603784.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种筒体衬板自动化装配平台
- 下一篇:塔形布置均匀播料装置





