[发明专利]一种语音识别的方法、装置有效
申请号: | 201310027559.9 | 申请日: | 2013-01-24 |
公开(公告)号: | CN103971680B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 蒋洪睿;王细勇;梁俊斌;郑伟军;周均扬 | 申请(专利权)人: | 华为终端(东莞)有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523808 广东省东莞市松山湖高新技术产业开*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 置信度 语音数据 语音识别 噪声 场景 方法和装置 灵活调整 噪声环境 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
获取语音数据;
识别所述语音数据的N个置信度值,并根据所述N个置信度值得到所述语音数据的总体置信度值,其中N大于或等于3;所述语音数据包括命令词,所述N个置信度值包括人名置信度值和命令词置信度值;
根据所述语音数据,获取噪声场景;所述噪声场景包括:噪声类型和噪声大小;
根据预先存储的置信度阈值经验数据和所述噪声场景包括的所述噪声类型和所述噪声大小的对应关系,获取与所述噪声场景对应的置信度阈值;
如果所述总体置信度值大于或者等于所述置信度阈值,则处理所述语音数据。
2.根据权利要求1所述的方法,其特征在于,所述噪声场景包括噪声类型,所述根据语音数据获取噪声场景,具体包括:
根据所述语音数据,获取所述语音数据中的噪声的频率倒谱系数;
根据所述噪声的频率倒谱系数和预先建立的噪声类型模型,获取所述语音数据的噪声类型。
3.根据权利要求2所述的方法,其特征在于,所述噪声类型模型的建立方法具体包括:
获取噪声数据;
根据所述噪声数据,获取所述噪声数据的频率倒谱系数;
根据EM算法处理所述频率倒谱系数,建立所述噪声类型模型。
4.根据权利要求2或者3所述的方法,其特征在于,所述噪声类型模型是,
高斯混合模型。
5.根据权利要求1所述的方法,其特征在于,所述噪声场景包括噪声大小,所述根据语音数据获取噪声场景,具体包括:
根据所述语音数据,获取所述语音数据的特征参数;
根据所述特征参数,进行语音激活检测;
根据所述语音激活检测的结果,获取所述噪声大小。
6.根据权利要求1或5所述的方法,其特征在于,所述噪声大小具体包括:
信噪比;
噪声能量水平。
7.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
如果所述总体置信度值小于所述置信度阈值,则提示用户。
8.一种语音识别装置,其特征在于,所述装置包括:
获取单元,用于获取语音数据;
置信度值单元,用于接收所述获取单元获取的所述语音数据,并识别所述语音数据的N个置信度值,根据所述N个置信度值得到所述语音数据的总体置信度值,其中N大于或等于3;所述语音数据包括命令词,所述N个置信度值包括人名置信度值和命令词置信度值;
噪声场景单元,用于接收所述获取单元获取的所述语音数据,并根据所述语音数据获取噪声场景;所述噪声场景包括:噪声类型和噪声大小;
置信度阈值单元,用于接收所述噪声场景单元的所述噪声场景,并根据预先存储的置信度阈值经验数据和所述噪声场景包括的所述噪声类型和所述噪声大小的对应关系,获取与所述噪声场景对应的置信度阈值;
处理单元,用于接收所述置信度值单元获取的所述总体置信度值和所述置信度阈值单元获取的所述置信度阈值,如果所述总体置信度值大于或者等于所述置信度阈值,则处理所述语音数据。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
建模单元,用于获取噪声数据,根据所述噪声数据,获取所述噪声数据的频率倒谱系数,根据EM算法处理所述频率倒谱系数,建立噪声类型模型。
10.根据权利要求9所述的装置,其特征在于,所述噪声场景单元具体包括:
噪声类型单元,用于根据所述获取单元的所述语音数据,获取所述语音数据中的噪声的频率倒谱系数,根据所述噪声的频率倒谱系数和所述建模单元的所述噪声类型模型,获取所述语音数据的噪声类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端(东莞)有限公司,未经华为终端(东莞)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310027559.9/1.html,转载请声明来源钻瓜专利网。