[发明专利]语音识别方法及语音识别装置有效
申请号: | 201710082111.5 | 申请日: | 2017-02-15 |
公开(公告)号: | CN108447471B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 万秋生 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04;G10L15/26 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
一种语音识别方法及装置,一个实施例的方法包括:确定待识别语音信息的语意信息,在语意信息不满足预设规则时,对待识别语音信息进行分段,获得各语音片段,并提取各语音片段的声纹信息,在本地声纹数据库中存在尚未匹配过的声纹信息时,从本地声纹数据库中获取一个尚未匹配过的声纹信息作为待匹配声纹信息,对各语音片段的声纹信息与待匹配声纹信息进行匹配,从各语音片段的声纹信息中确定出与待匹配声纹信息匹配成功的筛选后声纹信息,将各筛选后声纹信息对应的语音片段进行组合,获得组合语音信息,并确定组合语音信息的组合语意信息,在组合语意信息满足预设规则时,将组合语意信息作为语音识别结果。基于本实施例方案进行语音识别准确性高。
技术领域
本发明涉及计算机信息处理技术领域,特别涉及一种语音识别方法及语音识别装置。
背景技术
随着智能技术的发展,进行语音识别并根据识别的语音进行控制,已成为智能技术应用中的一项重要内容,各种智能产品中应用语音识别技术以实现智能化控制,随着智能产品的增加以及对语音识别的准确度的要求越来越高,各种语音识别技术层出不穷。
目前常用的语音识别方式是通过提取用户发出的待识别语音信息的特征,再根据识别算法对该用户发出的待识别语音信息进行识别。然而,在多人讲话的场合(如车内)使用语音识别功能,捕获到的待识别语音信息可能包含多人的说话内容,其中只有一个人的待识别语音信息是有效的,存在他人发出的噪音,无法识别出正确的语意,导致语音识别准确性不足。
发明内容
基于此,有必要针对语音识别准确性不足的问题,提出一种能提高语音识别准确性的语音识别方法及装置。
据此,本实施例采用以下技术方案:
一种语音识别方法,包括以下步骤:
获取采集的待识别语音信息,并确定所述待识别语音信息的语意信息;
在所述语意信息不满足预设规则时,对所述待识别语音信息进行分段处理,获得各语音片段,并提取各所述语音片段的声纹信息;
在本地声纹数据库中存在尚未匹配过的声纹信息时,从所述本地声纹数据库中获取一个尚未匹配过的声纹信息作为待匹配声纹信息;
对各所述语音片段的声纹信息与所述待匹配声纹信息进行匹配,从各所述语音片段的声纹信息中确定出与所述待匹配声纹信息匹配成功的筛选后声纹信息;
将各所述筛选后声纹信息对应的语音片段进行组合,获得组合语音信息,并确定所述组合语音信息的组合语意信息;
在所述组合语意信息满足所述预设规则时,将所述组合语意信息作为语音识别结果。
一种语音识别装置,包括:
语意信息确定模块,用于获取采集的待识别语音信息,并确定所述待识别语音信息的语意信息;
分段声纹获取模块,用于在所述语意信息不满足预设规则时,对所述待识别语音信息进行分段处理,获得各语音片段,并提取各所述语音片段的声纹信息;
待匹配声纹信息获取模块,用于在本地声纹数据库中存在尚未匹配过的声纹信息时,从所述本地声纹数据库中获取一个尚未匹配过的声纹信息作为待匹配声纹信息;
匹配筛选模块,用于对各所述语音片段的声纹信息与所述待匹配声纹信息进行匹配,从各所述语音片段的声纹信息中确定出与所述待匹配声纹信息匹配成功的筛选后声纹信息;
组合模块,用于将各所述筛选后声纹信息对应的语音片段进行组合,获得组合语音信息,并确定所述组合语音信息的组合语意信息;
识别结果确定模块,用于在所述组合语意信息满足所述预设规则时,将所述组合语意信息作为语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710082111.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于声道和韵律特征的情感语音转换方法
- 下一篇:语音唤醒方法及装置