[发明专利]语音强制对齐模型评价方法、装置、电子设备及存储介质有效
| 申请号: | 202010925650.2 | 申请日: | 2020-09-07 |
| 公开(公告)号: | CN111798868B | 公开(公告)日: | 2020-12-08 |
| 发明(设计)人: | 郭立钊;杨嵩;袁军峰 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
| 主分类号: | G10L25/27 | 分类号: | G10L25/27;G10L25/48;G10L13/02;G10L13/08 |
| 代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 李丽 |
| 地址: | 100144 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 强制 对齐 模型 评价 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种语音强制对齐模型评价方法、装置、电子设备及存储介质,语音强制对齐模型评价方法包括:利用待评价语音强制对齐模型,根据测试集的各段音频和与各段所述音频对应的文本,获取每段所述音频所对应的音素序列和所述音素序列的各个音素的预测起止时间;根据所述预测起止时间和已知的所述音素序列的各个所述音素的基准起止时间,获取各个音素的时间准确性得分;根据各个所述音素的时间准确性得分,获取所述待评价语音强制对齐模型的时间准确性得分。本发明实施例所提供的语音强制对齐模型评价方法、装置、电子设备及存储介质,可以在较低成本的基础上,实现对语音强制对齐模型的准确性评价。
技术领域
本发明实施例涉及计算机领域,尤其涉及一种语音强制对齐模型评价方法、装置、电子设备及存储介质。
背景技术
随着计算机技术和深度学习技术的发展,语音合成技术成为一个重要的研究方向,并得到广泛以用,比如:语音播报、语音导航以及智能音箱等。
在语音合成中,需要对语音合成模型进行训练,以提高语音合成的性能,为了实现对于语音合成模型的训练,需要得到训练语音的音素时间点,而为了得到音素时间点,一般利用语音强制对齐技术(即机器标注)获取,语音强制对齐技术是通过强制对齐模型确定音素时间点的技术,其中强制对齐模型利用语音样本和与语音样本对应的文本标注样本训练得到。
然而,通过强制对齐模型得到的音素时间点是否准确,或者经过优化后,强制对齐模型得到的音素时间点是否好于优化前,都需要进行评价,为此,或者通过人工复验的方式进行主观的评价,或者利用后续的语音合成过程,只改变优化前和优化后的对齐时间,通过合成的语音进行主观打分,这需要消耗大量的人工成本和时间成本。
为此,如何在较低成本的基础上,实现对语音强制对齐模型的准确性评价,就成为亟需解决的技术问题。
发明内容
本发明实施例提供一种语音强制对齐模型评价方法、装置、电子设备及存储介质,以在较低成本的基础上,实现对语音强制对齐模型的准确性评价。
为解决上述问题,本发明实施例提供一种语音强制对齐模型评价方法,包括:
利用待评价语音强制对齐模型,根据测试集的各段音频和与各段所述音频对应的文本,获取每段所述音频所对应的音素序列和所述音素序列的各个音素的预测起止时间;
根据所述预测起止时间和预先已知的所述音素序列的各个所述音素的基准起止时间,获取各个所述音素的时间准确性得分,其中,所述时间准确性得分为各个所述音素对应的所述预测起止时间与对应的所述基准起止时间的接近程度;
根据各个所述音素的时间准确性得分,获取所述待评价语音强制对齐模型的时间准确性得分。
为解决上述问题,本发明实施例提供一种语音强制对齐模型评价装置,包括:
音素序列及预测起止时间获取单元,适于利用待评价语音强制对齐模型,根据测试集的各段音频和与各段所述音频对应的文本,获取每段所述音频所对应的音素序列和所述音素序列的各个音素的预测起止时间;
音素时间准确性得分获取单元,适于根据所述预测起止时间和预先已知的所述音素序列的各个所述音素的基准起止时间,获取各个所述音素的时间准确性得分,其中,所述时间准确性得分为各个所述音素对应的所述预测起止时间与对应的所述基准起止时间的接近程度;
模型时间准确性得分获取单元,适于根据各个所述音素的时间准确性得分,获取所述待评价语音强制对齐模型的时间准确性得分。
为解决上述问题,本发明实施例提供一种存储介质,所述存储介质存储有适于语音强制对齐模型评价的程序,以实现如前述任一项所述的语音强制对齐模型评价方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925650.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低热收缩率银粉的制备方法
- 下一篇:程序指令块处理方法及装置





