[发明专利]一种连读的检测方法、装置、设备及存储介质有效
申请号: | 202110312558.3 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113053415B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 曾慧 | 申请(专利权)人: | 北京如布科技有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/27 |
代理公司: | 北京云知万象专利代理事务所(普通合伙) 16013 | 代理人: | 何辉 |
地址: | 100038 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 方法 装置 设备 存储 介质 | ||
本申请提供一种连读的检测方法、装置、设备及存储介质,该方法,包括:获取待评测的英语语音;将所述英语语音输入逻辑扩展图进行识别,所述逻辑扩展图包括插入静音模型的第一发音路径和未插入静音模型的第二发音路径;如果识别结果中没有停顿表征,则检测所述英语语音的发音为连读。采用本申请实施例的检测方法,通过是否有停顿表征,准确识别英语发音是否进行了连读,准确度高。
技术领域
本申请涉及语音检测领域,具体涉及一种连读的检测方法、装置、设备及存储介质。
背景技术
在英文口语中,上一个单词的辅音和下一个单词的开头元音连读是一种常见的上下文发音协同现象。在口语发音评测中,需要对发音人在口语中是否连读进行考核。目前常用的评测方式是通过声学模型对语音信息进行识别。由于是否连读从音标上是无法体现区别的,例如it is(不连读)和it(-)is(连读),其中,‘(-)’用于表示上一个单词的辅音和下一个单词的开头元音连读,其音标标记和声学模型的音素发音标记一样,例如,it is无论是否连读,其音标标记和声学模型的音素发音标记均为:/ItIz/,这样就难以通过声学模型区分度对连读进行区分。
发明内容
本申请提供一种连读的检测方法、装置、设备及存储介质,检测准确度高。
为实现上述目的,本申请实施例提供一种连读的检测方法,包括:
获取待评测的英语语音;
将所述英语语音输入逻辑扩展图进行识别,所述逻辑扩展图包括插入静音模型的第一发音路径和未插入静音模型的第二发音路径;
如果识别结果中没有停顿表征,则检测所述英语语音的发音为连读。
进一步的,在将所述英语语音输入逻辑扩展图进行识别之前,还包括:
获取所述英语语音的参考文本,所述参考文本包括表示连读的标记;
抽取所述参考文本中的标记,得到正常文本,并生成所述正常文本对应的相互对抗的第一语法和第二语法,所述第一语法为所述正常文本中连读单词之间插入静音模型得到的语法,所述第二语法为所述正常文本中连读单词之间未插入静音模型得到的语法;
编译所述第一语法和第二语法,得到连读三因子模型的逻辑扩展图,所述逻辑扩展图包括与所述第一语法对应的第一发音路径和与所述第二语法对应的第二发音路径。
进一步的,还包括:
如果识别结果中有停顿表征,则检测所述英语语音的发音为非连读。
进一步的,识别结果中有停顿表征包括:
所述停顿表征对应的发音停顿和变化被所述静音模型吸收。
为实现上述目的,本申请实施例还提供一种连读的检测装置,包括:
获取单元,设置为获取待评测的英语语音;
识别单元,设置为将所述英语语音输入逻辑扩展图进行识别,所述逻辑扩展图包括插入静音模型的第一发音路径和未插入静音模型的第二发音路径;
检测单元,设置为如果识别结果中没有停顿表征,则检测所述英语语音的发音为连读。
进一步的,所述获取单元还设置为:
获取所述英语语音的参考文本,所述参考文本包括表示连读的标记;
抽取所述参考文本中的标记,得到正常文本,并生成所述正常文本对应的相互对抗的第一语法和第二语法,所述第一语法为所述正常文本中连读单词之间插入静音模型得到的语法,所述第二语法为所述正常文本中连读单词之间未插入静音模型得到的语法;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京如布科技有限公司,未经北京如布科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110312558.3/2.html,转载请声明来源钻瓜专利网。