[发明专利]一种语音识别的方法、装置有效
申请号: | 201310027559.9 | 申请日: | 2013-01-24 |
公开(公告)号: | CN103971680B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 蒋洪睿;王细勇;梁俊斌;郑伟军;周均扬 | 申请(专利权)人: | 华为终端(东莞)有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523808 广东省东莞市松山湖高新技术产业开*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 置信度 语音数据 语音识别 噪声 场景 方法和装置 灵活调整 噪声环境 | ||
本发明实施例提供一种语音识别的方法,包括:获取语音数据;根据所述语音数据,获取置信度值;根据所述语音数据,获取噪声场景;获取与所述噪声场景对应的置信度阈值;如果所述置信度值大于或者等于所述置信度阈值,则处理所述语音数据。以及一种装置。这种根据噪声场景,灵活调整者置信度阈值的方法和装置,大大提升了噪声环境下的语音识别率。
技术领域
本发明实施例涉及语音处理技术领域,尤其涉及一种语音识别的方法及装置。
背景技术
用户在手机等终端设备上一般使用语音助手软件用来进行语音识别。用语音助手等软件进行语音识别的过程为,用户开启语音助手软件,获取语音数据;语音数据送到降噪模块进行降噪处理;降噪处理后的语音数据送给语音识别引擎;语音识别引擎返回识别结果给语音助手;语音助手为减少误判,根据置信度阈值判断识别结果的正确性,然后呈现。
目前,语音助手类软件通常是在办公室等安静环境下使用效果相对较好,但在噪声环境下(如:车载环境下)的使用效果不佳;业界普遍采用软件降噪的方法来提升语音识别率,但提升效果并不明显,有时甚至会降低识别率。
发明内容
本技术方案提供一种语音识别的方法和装置,用以提升语音识别率,同时提升用户感受。
第一方面,提供一种语音识别的方法:所述方法包括:获取语音数据;根据所述语音数据,获取置信度值;根据所述语音数据,获取噪声场景;获取与所述噪声场景对应的置信度阈值;如果所述置信度值大于或者等于所述置信度阈值,则处理所述语音数据。
结合第一方面,在第一方面的第一种可能的实现方式中,所述噪声场景具体包括:噪声类型;噪声大小。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述噪声场景包括噪声类型,所述根据语音数据获取噪声场景,具体包括:根据所述语音数据,获取所述语音数据中的噪声的频率倒谱系数;根据所述噪声的频率倒谱系数和预先建立的噪声类型模型,获取所述语音数据的噪声类型。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述噪声类型模型的建立方法具体包括:获取噪声数据;根据所述噪声数据,获取所述噪声数据的频率倒谱系数;根据EM算法处理所述频率倒谱系数,建立所述噪声类型模型。
结合第一方面的第三种可能的实现方式或者第一方面的第二种可能的实现方式,在第一方面的第四种可能的实现方式中,所述噪声类型模型是,高斯混合模型。
结合第一方面的第一种可能的实现方式,在第一方面的第五种可能的实现方式中,所述噪声场景包括噪声大小,所述根据语音数据获取噪声场景,具体包括:根据所述语音数据,获取所述语音数据的特征参数;根据所述特征参数,进行语音激活检测;根据所述语音激活检测的结果,获取所述噪声大小。
结合第一方面的第一种可能的实现方式或者第一方面的第二种可能的实现方式或者第一方面的第三种可能的实现方式或者第一方面的第四种可能的实现方式或者第一方面的第五种可能的实现方式或者,在第一方面的第六种可能的实现方式中,所述噪声大小具体包括:信噪比;噪声能量水平。
结合第一方面或者第一方面的第一种可能的实现方式或者第一方面的第二种可能的实现方式或者第一方面的第三种可能的实现方式或者第一方面的第四种可能的实现方式或者第一方面的第五种可能的实现方式或者第一方面的第六种可能的实现方式或者,在第一方面的第七种可能的实现方式中,所述获取与所述噪声场景对应的置信度阈值,具体包括:根据预先存储的置信度阈值经验数据和所述噪声场景的对应关系,获取与所述噪声场景对应的置信度阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端(东莞)有限公司,未经华为终端(东莞)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310027559.9/2.html,转载请声明来源钻瓜专利网。