[发明专利]一种爆破音的评测方法、装置、设备及存储介质有效
| 申请号: | 202110313338.2 | 申请日: | 2021-03-24 |
| 公开(公告)号: | CN113077822B | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 曾慧 | 申请(专利权)人: | 北京如布科技有限公司 |
| 主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/27 |
| 代理公司: | 北京云知万象专利代理事务所(普通合伙) 16013 | 代理人: | 何辉 |
| 地址: | 100038 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 爆破 评测 方法 装置 设备 存储 介质 | ||
本申请提供一种爆破音的评测方法、装置、设备及存储介质,该方法包括:获取待评测的英语语音;将所述英语语音送入解码图强制对齐进行识别,所述解码图包括带爆破音的第一发音路径和不带爆破音的第二发音路径;如果识别过程采用解码图中的第二发音路径,则评测所述英语语音的发音失去爆破。采用本申请实施例的评测方式,相对于直接通过声学频谱特征评测英语发音是否失去爆破音的方式,评测准确度更高。
技术领域
本申请涉及语音评测领域,具体涉及一种爆破音的评测方法、装置、设备及存储介质。
背景技术
在英文口语中,对于爆破音在发音时失去爆破是一种常见的上下文发音协同现象。在口语发音评测中,需要对发音人在口语中是否对于爆破音在发音时失去爆破进行考核。目前常用的评测方式是通过声学模型对语音信息进行识别。由于爆破音是辅音的一种,在声学频谱特征上并不具备元音那样较为明显的特征,因此直接通过声学模型层面的建模区分度来判断是否此爆破音已经发音还是没有发音,并不能得到非常可靠的判断。
发明内容
本申请提供一种爆破音的评测方法、装置、设备及存储介质,评测准确度高。
为实现上述目的,本申请实施例提供一种爆破音的评测方法,包括:
获取待评测的英语语音;
将所述英语语音送入解码图强制对齐进行识别,所述解码图包括带爆破音的第一发音路径和不带爆破音的第二发音路径;
如果识别过程采用解码图中的第二发音路径,则评测所述英语语音的发音失去爆破。
进一步的,在将所述英语语音送入解码图进行强制对齐识别之前,还包括:
获取所述英语语音的参考文本,所述参考文本包括表示对预设辅音失去爆破的标记;
抽取所述参考文本中的标记,得到正常文本,并生成所述正常文本对应的识别语法;
生成所述参考文本中带有标记的第一单词对应的带爆破音的第一发音和不带爆破音的第二发音;
根据所述第一发音和第二发音编译所述识别语法,得到所述解码图,所述解码图中的第一发音路径对应第一发音,所述解码图中的第二发音路径对应第二发音。
进一步的,还包括:
如果识别过程采用解码图中的第一发音路径,且所述英语语音中所述第一单词的发音中所述预设辅音的发音时长小于预设时长,则评测所述英语语音的发音失去爆破。
进一步的,所述预设时长为30ms.
进一步的,还包括:
如果识别过程采用解码图中的第一发音路径,且所述英语语音中所述第一单词的发音中所述预设辅音的发音时长大于等于预设时长,以及所述预设辅音的发音的置信度大于置信度阈值,则评测所述英语语音的发音失去爆破。
进一步的,所述置信度阈值的取值范围为[0.6,0.8]。
为实现上述目的,本申请实施例还提供一种爆破音的评测装置,包括:
获取单元,设置为获取待评测的英语语音;
识别单元,设置为将所述英语语音送入解码图强制对齐进行识别,所述解码图包括带爆破音的第一发音路径和不带爆破音的第二发音路径;
评测单元,设置为如果识别过程采用解码图中的第二发音路径,则评测所述英语语音的发音失去爆破。
为实现上述目的,本申请实施例提供一种设备,包括:
一个或多个处理器;
存储器,设置为存储一个或多个程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京如布科技有限公司,未经北京如布科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110313338.2/2.html,转载请声明来源钻瓜专利网。





