[发明专利]语音强制对齐模型评价方法、装置、电子设备及存储介质有效
| 申请号: | 202010925650.2 | 申请日: | 2020-09-07 |
| 公开(公告)号: | CN111798868B | 公开(公告)日: | 2020-12-08 |
| 发明(设计)人: | 郭立钊;杨嵩;袁军峰 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
| 主分类号: | G10L25/27 | 分类号: | G10L25/27;G10L25/48;G10L13/02;G10L13/08 |
| 代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 李丽 |
| 地址: | 100144 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 强制 对齐 模型 评价 方法 装置 电子设备 存储 介质 | ||
1.一种语音强制对齐模型评价方法,其特征在于,包括:
利用待评价语音强制对齐模型,根据测试集的各段音频和与各段所述音频对应的文本,获取每段所述音频所对应的音素序列和所述音素序列的各个音素的预测起止时间;
根据所述预测起止时间和已知的所述音素序列的各个所述音素的基准起止时间,获取各个所述音素的时间准确性得分,其中,所述时间准确性得分为各个所述音素的所述预测起止时间与对应的所述基准起止时间的接近程度;
根据各个所述音素的时间准确性得分,获取所述待评价语音强制对齐模型的时间准确性得分。
2.如权利要求1所述的语音强制对齐模型评价方法,其特征在于,所述根据各个所述音素的时间准确性得分,获取所述待评价语音强制对齐模型的时间准确性得分的步骤之前,还包括:
确定当前音素,构建所述当前音素的音素组合,获取各个音素的音素组合,所述音素组合包括所述当前音素和与所述当前音素临近的至少一个音素,各个音素的音素组合的组合方式相同;
所述根据各个所述音素的时间准确性得分,获取所述待评价语音强制对齐模型的时间准确性得分的步骤包括:
根据各个所述音素组合中的各个音素的时间准确性得分,获取各个所述音素组合中当前音素的时间准确性修正得分,得到所述音素序列的各个音素的时间准确性修正得分;
根据所述音素序列的各个音素的时间准确性修正得分,获取所述待评价语音强制对齐模型的时间准确性得分。
3.如权利要求2所述的语音强制对齐模型评价方法,其特征在于,所述确定当前音素,构建所述当前音素的音素组合,获取各个音素的音素组合的步骤之后,还包括:
根据所述音素组合中的各音素的发音方式对所述音素组合进行分类,得到所述音素组合的组合类别,并根据各个音素组合的组合类别,确定同一组合类别的音素组合的数量以及对应的组合权重,其中,所述组合权重为同一组合类别的音素组合的数量与所述音素序列中音素总量的比值;
所述根据所述音素序列的各个音素的时间准确性修正得分,获取所述待评价语音强制对齐模型的时间准确性得分的步骤包括:
根据各个音素的时间准确性修正得分和所述音素对应的所述音素组合的组合权重,获取各个所述音素的权重得分;
根据所述音素序列的各个音素的权重得分,获取所述待评价语音强制对齐模型的时间准确性得分。
4.如权利要求3所述的语音强制对齐模型评价方法,其特征在于,所述当前音素的音素组合包括二音素组合和三音素组合,所述二音素组合包括所述当前音素和与所述当前音素直接相邻的一个音素,所述三音素组合包括所述当前音素和与所述当前音素直接相邻的两个音素;
所述组合类别包括各个二音素组合类别和各个三音素组合类别,所述组合权重包括与各个所述二音素组合类别对应的二音素组合权重和与各个所述三音素组合类别对应的三音素组合权重,所述时间准确性修正得分包括各个所述当前音素的二音素时间准确性修正得分和三音素时间准确性修正得分,所述权重得分包括各个所述当前音素的二音素权重得分和三音素权重得分;
所述根据所述音素序列的各个音素的权重得分,获取所述待评价语音强制对齐模型的时间准确性得分的步骤包括:
根据所述当前音素的所述二音素权重得分和所述三音素权重得分获取所述当前音素的融合权重得分;
根据所述音素序列的各个音素的融合权重得分,获取所述待评价语音强制对齐模型的时间准确性得分。
5.如权利要求4所述的语音强制对齐模型评价方法,其特征在于,所述二音素组合包括所述当前音素和所述当前音素前的音素。
6.如权利要求4所述的语音强制对齐模型评价方法,其特征在于,所述融合权重得分通过以下公式获取:
score=v2*score’’+ v3*score”’;
其中:v2+v3=1,且v3v2;
score为融合权重得分;
score’’为二音素权重得分;
v2为二音素融合因子;
score”’为三音素权重得分;
v3为三音素融合因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925650.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低热收缩率银粉的制备方法
- 下一篇:程序指令块处理方法及装置





