[发明专利]语音识别装置和语音识别方法有效
申请号: | 201510601128.8 | 申请日: | 2015-09-18 |
公开(公告)号: | CN105529026B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 房圭燮;李昌宪 | 申请(专利权)人: | 现代自动车株式会社 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 陈鹏;李静 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 | ||
1.一种语音识别装置,包括:
收集器,从基于语音的装置收集第一说话者的语音数据;
第一存储器,累积所述第一说话者的语音数据;
学习器,学习累积在所述第一存储器中的所述第一说话者的语音数据并且所述学习器基于所学习的语音数据生成所述第一说话者的个人声学模型;
第二存储器,存储通用声学模型和所述第一说话者的个人声学模型;
特征向量提取器,当从所述第一说话者接收到语音识别请求时,所述特征向量提取器从所述第一说话者的语音数据提取特征向量;以及
语音识别器,基于所述第一说话者的语音数据的累积量来选择所述通用声学模型和所述第一说话者的个人声学模型中的任一个并且所述语音识别器使用所提取的特征向量和所选择的声学模型识别语音命令,
其中,当所述第一说话者的语音数据的累积量大于或等于预定阈值时,所述语音识别器选择所述第一说话者的个人声学模型;并且当所述第一说话者的语音数据的累积量小于所述预定阈值时,所述语音识别器选择所述通用声学模型。
2.根据权利要求1所述的语音识别装置,进一步包括检测并且去除所述第一说话者的语音数据中的噪声的预处理器。
3.根据权利要求1所述的语音识别装置,其中,
所述收集器收集包括所述第一说话者的多个说话者的语音数据;并且
所述第一存储器累积所述多个说话者的各个说话者的语音数据。
4.根据权利要求3所述的语音识别装置,其中,所述学习器学习所述多个说话者的语音数据并且所述学习器基于所学习的所述多个说话者的语音数据生成用于各个说话者个人声学模型。
5.根据权利要求3所述的语音识别装置,其中,所述学习器学习所述多个说话者的语音数据并且基于所学习的所述多个说话者的语音数据来更新所述通用声学模型。
6.根据权利要求1所述的语音识别装置,进一步包括执行与所识别的语音命令相对应的功能的识别结果处理器。
7.一种语音识别方法,包括:
从基于语音的装置收集第一说话者的语音数据;
将所述第一说话者的语音数据累积在第一存储器中;
学习所累积的所述第一说话者的语音数据;
基于所学习的语音数据生成所述第一说话者的个人声学模型;
将通用声学模型和所述第一说话者的个人声学模型存储在第二存储器中;
当从所述第一说话者接收到语音识别请求时,从所述第一说话者的语音数据提取特征向量;
基于所述第一说话者的语音数据的累积量来选择所述通用声学模型和所述第一说话者的个人声学模型中的任一个;以及
使用所提取的特征向量和所选择的声学模型识别语音命令,
所述语音识别方法进一步包括:
将所述第一说话者的语音数据的累积量与预定阈值进行比较;
当所述第一说话者的语音数据的累积量大于或等于所述预定阈值时,选择所述第一说话者的个人声学模型;并且
当所述第一说话者的语音数据的累积量小于所述预定阈值时,选择所述通用声学模型。
8.根据权利要求7所述的语音识别方法,进一步包括检测并且去除所述第一说话者的语音数据中的噪声。
9.根据权利要求7所述的语音识别方法,进一步包括:
收集包括所述第一说话者的多个说话者的语音数据;并且
在所述第一存储器中累积所述多个说话者的各个说话者的语音数据。
10.根据权利要求9所述的语音识别方法,进一步包括:
学习所述多个说话者的语音数据;并且
基于所学习的所述多个说话者的语音数据生成用于各个说话者的个人声学模型。
11.根据权利要求9所述的语音识别方法,进一步包括:
学习所述多个说话者的语音数据;并且
基于所学习的所述多个说话者的语音数据更新所述通用声学模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于现代自动车株式会社,未经现代自动车株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510601128.8/1.html,转载请声明来源钻瓜专利网。