[发明专利]发音质量检测方法、系统、移动终端及存储介质在审
申请号: | 202110228528.4 | 申请日: | 2021-03-02 |
公开(公告)号: | CN112967736A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 陈剑超;肖龙源;李稀敏;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音 质量 检测 方法 系统 移动 终端 存储 介质 | ||
本发明提供了一种发音质量检测方法、系统、移动终端及存储介质,该方法包括:对待检测音频和标准音频进行音节对齐和音段分割,得到待检测音段和目标音段,对待检测音段和目标音段进行音频帧对齐,得到对齐路径;根据对齐路径计算待检测音段与目标音段之间的基频相似度,对待检测音段与目标音段进行停顿检测;根据停顿检测结果计算待检测音段与目标音段之间的停顿相似度,对停顿相似度和基频相似度进行权值计算得到发音质量检测值;若发音质量检测值大于检测阈值,判定待检测音频的发音质量合格。本发明基于发音质量检测值能自动判断待检测音频的发音质量检测是否合格,无需采用人工的方式进行音频数据发音质量检测,提高了发音质量检测的准确性。
技术领域
本发明涉及音频检测技术领域,尤其涉及一种发音质量检测方法、系统、移动终端及存储介质。
背景技术
计算机辅助语言教学是语音技术在语言教学领域发展的一个重要研究方向,主要的目的是利用计算机来帮助语言学习者更好地掌握一门第二语言。在学习过程中,老师的实时指导和反馈往往能极大地提高学习效率,口语教学尤为明显,但是传统教学模式存在明显的局限性:由于学习者数量众多,具有相应专业技能的师资数量不能满足庞大的需求,学习者难以得到即时的反馈,因此,计算机辅助语言教学应运而生,发音质量检测作为计算机辅助语言教学的重要内容备受关注。
现有的发音质量检测过程中,均是采用人工的方式进行音频数据发音质量的检测,进而导致发音质量检测准确性低下。
发明内容
本发明实施例的目的在于提供一种发音质量检测方法、系统、移动终端及存储介质,旨在解决现有的发音质量检测过程中,由于采用人工的方式进行音频数据发音质量检测,所导致的发音质量检测准确性低下的问题。
本发明实施例是这样实现的,一种发音质量检测方法,所述方法包括:
获取待检测音频和所述待检测音频对应的标准音频,并对所述待检测音频和所述标准音频进行音节对齐;
根据音节对齐结果对所述待检测音频和所述标准音频进行音段分割,得到待检测音段和目标音段,并对所述待检测音段和所述目标音段进行音频帧对齐,得到对齐路径;
根据所述对齐路径计算所述待检测音段与所述目标音段之间的基频相似度,并分别对音频帧对齐后所述待检测音段与所述目标音段进行停顿检测;
根据停顿检测结果计算所述待检测音段与所述目标音段之间的停顿相似度,并对所述停顿相似度和所述基频相似度进行权值计算,得到发音质量检测值;
若所述发音质量检测值大于检测阈值,则判定所述待检测音频的发音质量合格。
更进一步地,所述对所述待检测音段和所述目标音段进行音频帧对齐的步骤包括:
分别提取所述待检测音段和所述目标音段中音频帧的梅尔倒谱系数,得到待检测特征序列和目标特征序列;
分别获取所述待检测特征序列和所述目标特征序列的序列长度,得到第一长度和第二长度,并根据所述第一长度和所述第二长度构建音频帧对齐矩阵;
根据所述音频帧对齐矩阵对所述待检测音段和所述目标音段进行音频帧对齐,得到所述对齐路径。
更进一步地,所述根据所述对齐路径计算所述待检测音段与所述目标音段之间的基频相似度所采用的计算公式为:
其中,DTW是所述基频相似度,Q是所述待检测特征序列,C是所述目标特征序列,w是所述对齐路径,wk是所述对齐路径上第k个点在所述音频帧对齐矩阵中的坐标。
更进一步地,所述分别对音频帧对齐后所述待检测音段与所述目标音段进行停顿检测的步骤包括:
分别获取所述待检测音段和所述目标音段中发音单元的起止位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110228528.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示组件、显示屏及电子设备
- 下一篇:基于谨慎度的用户身份识别方法