[发明专利]发音错误检测方法、装置、电子设备及存储介质在审
申请号: | 202010790901.0 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111862960A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 叶珑;雷延强;梁伟文 | 申请(专利权)人: | 广州视琨电子科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02;G10L15/14;G10L15/16;G10L25/60;G10L25/93 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 510700 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音 错误 检测 方法 装置 电子设备 存储 介质 | ||
本申请提供一种发音错误检测方法、装置、电子设备及存储介质。该方法包括:根据发音文本和待检测语音信号,获取待检测语音信号对应的第一音素状态序列及边界信息,待检测语音信号是针对发音文本的语音信号,边界信息用于区别第一音素状态序列中各状态对应的不同音素;针对第一音素状态序列中状态,确定状态对应的混淆音素状态中后验概率最大的状态;根据边界信息及后验概率最大的状态,确定状态所属音素对应的目标混淆音素;根据目标混淆音素,确定第一音素状态序列中对应音素是否发音错误。本申请基于第一音素状态序列中状态对应的混淆音素状态中后验概率最大的状态还原出状态所属音素对应的目标混淆音素(即实际音素),可加快发音检错速度。
技术领域
本申请涉及计算机辅助语言学习技术,尤其涉及一种发音错误检测方法、装置、电子设备及存储介质。
背景技术
发音错误检测(Mispronunciation Detection)技术是计算机辅助语言学习(Computer Assisted Language Learning,简称:CALL)技术的一个细分方向,发音错误检测技术要求高效、准确地还原出学习者的实际发音情况,并给出音素级别的客观反馈和评价,以帮助学习者纠正发音错误。
传统的基于音素循环网络的发音检错技术,是在无限制的音素循环网络中解码得到实际发音的音素状态序列,进而基于音素状态序列确定发音是否错误。发明人在使用该技术进行发音检错时,发现至少存在发音检错速度慢的问题。
发明内容
本申请提供一种发音错误检测方法、装置、电子设备及存储介质,以提升发音检错速度。
第一方面,本申请提供一种发音错误检测方法,该方法包括:根据发音文本和待检测语音信号,获取待检测语音信号对应的第一音素状态序列及边界信息,待检测语音信号是针对发音文本的语音信号,边界信息用于区别第一音素状态序列中各状态对应的不同音素;针对第一音素状态序列中状态,确定状态对应的混淆音素状态中后验概率最大的状态;根据边界信息及后验概率最大的状态,确定状态所属音素对应的目标混淆音素;根据目标混淆音素,确定第一音素状态序列中对应音素是否发音错误。
一种可能的实施方式中,上述确定状态对应的混淆音素状态中后验概率最大的状态,包括:在状态的持续时间内,遍历状态所属音素对应的混淆音素的状态,确定其中后验概率最大的状态。
一种可能的实施方式中,上述根据边界信息及后验概率最大的状态,确定状态所属音素对应的目标混淆音素,包括:根据边界信息,对后验概率最大的状态进行分组;根据分组中状态,确定状态所属音素对应的目标混淆音素。
一种可能的实施方式中,上述根据分组中状态,确定状态所属音素对应的目标混淆音素,包括:
若分组中状态同属于一音素,则确定该音素为状态所属音素对应的目标混淆音素;
若分组中状态不同属于一音素,则确定分组中后验概率最大的状态所属的音素为状态所属音素对应的目标混淆音素。
一种可能的实施方式中,上述根据发音文本和待检测语音信号,获取待检测语音信号对应的第一音素状态序列及边界信息,包括:
根据发音文本,构建初始加权有限状态转移器(Weighted Finite-StateTransducers,简称:WFST)对齐网络,其中,初始WFST对齐网络表示发音文本对应的音素的可能路径状态图;
根据待检测语音信号和初始WFST对齐网络,获取待检测语音信号对应的第一音素状态序列及边界信息。
一种可能的实施方式中,上述初始WFST对齐网络包含词间可选静音音素路径。
一种可能的实施方式中,上述根据目标混淆音素,确定第一音素状态序列中对应音素是否发音错误,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视琨电子科技有限公司,未经广州视琨电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010790901.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:双头打端套管自动加工设备
- 下一篇:一种高纯氧化铝陶瓷轴及其制备方法