[发明专利]语音测评方法、装置、电子设备及存储介质在审
申请号: | 201910106491.0 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109859741A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 林子盛;雷杰;王波 | 申请(专利权)人: | 成都终身成长科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/06;G10L15/08;G10L15/14;G10L15/30 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 栾波 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 状态链 音频数据 匹配状态 测评 特征向量 存储介质 电子设备 目标状态 例句 语音 评分规则 特征提取 状态转移 参考 向后 预设 匹配 概率 申请 | ||
本申请提供一种语音测评方法、装置、电子设备及存储介质,包括:获取待测评的音频数据;对音频数据进行特征提取,获得与音频数据对应的多个特征向量;获取用于表征音频数据对应的参考例句中每个词的排列顺序以及特征的第一状态链;基于第一状态链和多个特征向量,获取多个待匹配状态链,多个待匹配状态链中包括后跨状态链,后跨状态链表征所述参考例句中的前序词对应的状态向后序词对应的状态转移的概率不为0;从多个待匹配状态链中确定出与多个特征向量匹配的目标状态链;基于目标状态链、所述第一状态链以及预设评分规则,获得音频数据对应的第一评分,由于多个待匹配状态链中包括后跨状态链,继而提高语音测评结果精确度。
技术领域
本申请涉及语音测评技术领域,具体而言,涉及一种语音测评方法、装置、电子设备及存储介质。
背景技术
随着语音识别应用的普及,越来越多语言学习平台考虑到更多语音识别的变形应用,其中一种便是通过语音测评替代人工口语打分,及时为用户提供口语语音测评结果,然而,口语水平不足的用户在阅读参考例句时,可能遗漏或跳过参考例句中的一些单词,继而导致现有的语音测评技术的准确度不高。
申请内容
鉴于此,本申请实施例的目的在于提供一种语音测评方法、装置、电子设备及存储介质,以提高语音测评结果的准确度。
第一方面,本申请实施例提供一种语音测评方法,所述方法包括:获取待测评的音频数据;对所述音频数据进行特征提取,获得与所述音频数据对应的多个特征向量;获取用于表征所述音频数据对应的参考例句中每个词的排列顺序以及特征的第一状态链;基于所述第一状态链和所述多个特征向量,获取多个待匹配状态链,其中,所述多个待匹配状态链中包括后跨状态链,其中,所述后跨状态链表征所述参考例句中的前序词对应的状态向后序词对应的状态转移的概率不为0;从所述多个待匹配状态链中确定出与所述多个特征向量匹配的目标状态链;基于所述目标状态链、所述第一状态链以及预设评分规则,获得所述音频数据对应的第一评分。
在上述实现过程中,对于获取到的待测评的音频数据,获取所述音频数据对应的多个待匹配状态链,其中,所述多个待匹配状态链中包括后跨状态链,所述后跨状态链表征所述参考例句中的前序词对应的状态向后序词对应的状态转移的概率不为0,接着基于所述多个待匹配状态链确定出与所述音频数据匹配的目标状态链,最后基于所述目标状态链对所述音频数据进行打分,由于所述多个待匹配状态链中包括了后跨状态链,因此,在所述音频数据存在用户遗漏或跳过参考例句中的一些单词的情况下,也能准确的对所述音频数据打分。
基于第一方面,在一种可能的设计中,所述多个待匹配状态链中还包括前跨状态链,其中,所述前跨状态链表征所述参考例句中的所述后序词对应的状态向所述前序词对应的状态转移的概率不为0,获取多个待匹配状态链,包括:在所述第一状态链中设置前跨转移路径,获取第二状态链,其中,所述前跨转移路径表征所述参考例句中的所述后序词对应的状态向所述前序词对应的状态转移,所述前跨转移路径对应的状态转移的概率不为0;基于所述第二状态链和所述多个特征向量的数量,获取所述多个待匹配状态链。
在上述实现过程中,由于所述多个待匹配状态链中还包括前跨状态链,其中,所述前跨状态链表征所述参考例句中的所述后序词对应的状态向所述前序词对应的状态转移的概率不为0,并基于所述多个待匹配状态来对所述音频数据进行打分,因此,在所述音频数据存在用户遗漏或跳过参考例句中的一些单词的情况下,也能准确的对所述音频数据打分。
基于第一方面,在一种可能的设计中,获取多个待匹配状态链,包括:在所述第一状态链中设置后跨转移路径,获取第三状态链,其中,所述后跨转移路径表征所述参考例句中的所述前序词对应的状态向所述后序词对应的状态转移,所述后跨转移路径对应的状态转移的概率不为0;基于所述第三状态链和所述多个特征向量的数量,获取所述多个待匹配状态链。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都终身成长科技有限公司,未经成都终身成长科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910106491.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于多种方言识别的设备
- 下一篇:一种说话人分段聚类方法及装置