[发明专利]一种英语口语自动打分方法及系统有效
| 申请号: | 201510259574.5 | 申请日: | 2015-05-20 |
| 公开(公告)号: | CN104992705B | 公开(公告)日: | 2018-08-24 |
| 发明(设计)人: | 王东;李全忠;胡博 | 申请(专利权)人: | 普强信息技术(北京)有限公司;清华大学 |
| 主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/06 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100093 北京市海淀区东北旺*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 英语口语 自动 打分 方法 系统 | ||
1.一种英语口语自动打分方法,其特征在于,所述方法包括:
提取待测语音信号的多帧语音特征;
将所述多帧语音特征输入深度神经网络DNN模型,提取各帧语音特征的帧后验概率,所述DNN模型为预先训练的,DNN模型的输入量为帧语音特征,输出量为帧语音特征对不同发音的帧后验概率;
对所述各帧语音特征的帧后验概率进行分布统计,得到待测语音信号的全局特征;
利用多层前向神经网络模型MLP对所述全局特征进行打分。
2.根据权利要求1所述的方法,其特征在于,所述对所述各帧语音特征的帧后验概率进行分布统计,得到待测语音信号的全局特征,包括:
将所述多帧语音特征与预设音素串进行对齐,得到每帧语音特征在其对应的音素上的后验概率;
根据所述每帧语音特征在其对应的音素上的后验概率,对各帧语音特征在其对应的音素上的后验概率进行分布统计,得到待测语音信号的全局特征。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预设数据进行DNN模型训练。
4.一种英语口语自动打分系统,其特征在于,所述系统包括:
语音特征提取模块,用于提取待测语音信号的多帧语音特征;
帧后验概率提取模块,用于将所述语音特征提取模块提取的多帧语音特征输入深度神经网络DNN模型,提取各帧语音特征的帧后验概率,所述DNN模型为预先训练的,DNN模型的输入量为帧语音特征,输出量为帧语音特征对不同发音的帧后验概率;
分布统计模块,用于对所述帧后验概率提取模块提取的各帧语音特征的帧后验概率进行分布统计,得到待测语音信号的全局特征;
打分模块,用于利用多层前向神经网络模型MLP对所述全局特征进行打分。
5.根据权利要求4所述的系统,其特征在于,所述分布统计模块包括:
音素对齐单元,用于将所述多帧语音特征与预设音素串进行对齐,得到每帧语音特征在其对应的音素上的后验概率;
分布统计单元,用于根据所述每帧语音特征在其对应的音素上的后验概率,对各帧语音特征在其对应的音素上的后验概率进行分布统计,得到待测语音信号的全局特征。
6.根据权利要求4所述的系统,其特征在于,所述系统还包括:
DNN模型训练模块,用于根据预设数据进行DNN模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普强信息技术(北京)有限公司;清华大学,未经普强信息技术(北京)有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510259574.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:能识别音乐自动成谱的方法
- 下一篇:语音合成方法和系统





