[发明专利]用于儿童的语音识别方法及系统有效
申请号: | 201910516503.7 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110246489B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 钱彦旻;李晨达 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/065 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 儿童 语音 识别 方法 系统 | ||
1.一种用于儿童的语音识别方法,包括:
通过成人训练语料库确定所述成人训练语料库内各音频的声学特征;
基于预设目标儿童语音的声学特征对所述成人训练语料库中各音频进行韵律调整,以使得所述成人训练语料库内各音频的声学特征与目标儿童语音的声学特征匹配;
根据与目标儿童语音的声学特征匹配后的成人训练语料库训练语音识别模型,通过所述语音识别模型识别儿童语音;
其中,所述基于预设目标儿童语音的声学特征对所述成人训练语料库中各音频进行韵律调整包括:
修改所述成人训练语料库中各音频的基本频率,生成拟儿童训练语料库;
所述修改所述成人训练语料库中各音频的基本频率包括:
通过对所述成人训练语料库中各音频进行上/下采样,改变所述各音频的基本频率以及语速,使所述成人训练语料库中各音频的基本频率与目标儿童语音的基本频率匹配;
将由于在所述上/下采样中,成人训练语料库中各音频随所述基本频率变动的语速,还原为所述成人训练语料库中各音频在上/下采样前的语速。
2.根据权利要求1所述的方法,其中,在语音识别模型识别解码中,使用联合解码确定儿童语音的识别结果。
3.一种用于儿童的语音识别系统,包括:
声学特征确定程序模块,用于通过成人训练语料库确定所述成人训练语料库内各音频的声学特征;
特征匹配程序模块,用于基于预设目标儿童语音的声学特征对所述成人训练语料库中各音频进行韵律调整,以使得所述成人训练语料库内各音频的声学特征与目标儿童语音的声学特征匹配;
语音识别程序模块,用于根据与目标儿童语音的声学特征匹配后的成人训练语料库训练语音识别模型,通过所述语音识别模型识别儿童语音;
其中,所述特征匹配程序模块用于:修改所述成人训练语料库中各音频的基本频率,生成拟儿童训练语料库;
所述特征匹配程序模块还用于:
通过对成人训练语料库上/下采样,将所述成人训练语料库内各语音的基频趋向预设儿童语音基频参数调整;
将在所述上/下采样中各语音随所述基频变动的语速还原为所述各语音在上/下采样前的语速,将所述语速还原后的趋向儿童语音基频的各语音确定为儿童训练语料库;
提取所述成人训练语料库以及所述儿童训练语料库的音频特征,训练语音识别模型,通过所述语音识别模型对基频高于成人的儿童语音进行识别。
4.根据权利要求3所述的系统,其中,在语音识别模型识别解码中,使用联合解码确定儿童语音的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910516503.7/1.html,转载请声明来源钻瓜专利网。