[发明专利]语音处理方法、装置、设备和存储介质在审
| 申请号: | 202011438604.6 | 申请日: | 2020-12-10 |
| 公开(公告)号: | CN112634901A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 林炳怀;王丽园 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02;G10L25/51 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 常忠良 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 方法 装置 设备 存储 介质 | ||
本申请提供了一种语音处理方法、装置、设备和存储介质,该方法包括:确定评测语音对应的评测文本及评测文本中各个字的拼音识别结果,拼音识别结果包括:字的评测拼音、评测拼音中至少一个拼音音素以及拼音音素的发音置信度;基于字的评测拼音中各拼音音素、拼音音素所属的音素类别以及拼音音素的发音置信度,确定字中每个拼音音素的音素评分;针对评测文本中每个字,依据字的评测拼音中各拼音音素的音素评分,确定字的字评分;按照评测文本中各个字的字评分,确定评测语音的综合发音评分;向终端输出评测语音的评测结果。本申请的方案能够更为全面和真实的反映普通话评测者的普通话评测的发音情况,有利于及时发现并纠正发音错误。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音处理方法、装置、设备和存储介质。
背景技术
中文学习者或者普通话练习者可以利用口语评测应用来测试其发音情况的口语评分。
然而,目前的口语评测方式所提供的口语评分无法较为真实和全面反映出普通话评测者的发音情况,不利于普通话评测者及时发现并纠正发音错误,提升口语水平。
发明内容
有鉴于此,本申请提供了一种语音处理方法、装置、设备和存储介质,以能够更为全面和真实的反映普通话评测者的普通话评测的发音情况,有利于及时发现并纠正发音错误。
为实现上述目的,本申请提供了如下技术方案:
一方面,本申请提供了一种语音处理方法,包括:
获得用户针对测试用的参考文本输入的评测语音;
对所述评测语音进行语音识别,得到语音识别结果,所述语音识别结果包括所述评测语音对应的评测文本以及所述评测文本中各个字的拼音识别结果,其中,字的拼音识别结果包括:所述字的评测拼音、所述评测拼音中至少一个拼音音素以及所述拼音音素的发音置信度;
针对所述评测文本中每个字,基于所述字的评测拼音中各拼音音素、所述拼音音素所属的音素类别以及所述拼音音素的发音置信度,确定所述字中每个拼音音素的音素评分,所述音素评分表征所述音素发音的准确度,拼音音素所属的音素类别为声母和韵母中的一种;
针对所述评测文本中每个字,依据所述字的评测拼音中各拼音音素的音素评分,确定所述字的字评分,其中,字的字评分用于表征字的发音准确程度;
按照所述评测文本中各个字的字评分,确定所述评测语音的综合发音评分;
向终端输出所述评测语音的评测结果,所述评测结果包括:所述评测文本、所述评测文本中各个字的字评分以及所述综合发音评分。
在一种可能的实现方式中,所述字的拼音识别结果还包括:所述字的评测拼音的评测音调;
在所述确定所述字的字评分之前,还包括:
确定所述参考文本中各参考字的参考拼音的参考音调;
依据所述参考文本中各个参考字对应的参考音调,分别确定所述评测文本中各个字的评测拼音对应的评测音调的音调评测结果,所述评测音调的音调评测结果用于表征所述评测音调正确或者错误;
所述依据所述字的评测拼音中各拼音音素的音素评分,确定所述字的字评分,包括:
依据所述字的评测拼音中各拼音音素的音素评分和所述评测拼音对应的评测音调的音调评测结果,确定所述字的字评分。
在又一种可能的实现方式中,基于所述字的评测拼音中各拼音音素、所述拼音音素所属的音素类别以及所述拼音音素的发音置信度,确定所述字中每个拼音音素的音素评分,包括:
依据不同拼音音素对应的音素特征,确定所述字的评测拼音中各拼音音素的音素特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011438604.6/2.html,转载请声明来源钻瓜专利网。





