[发明专利]语音质量检测模型的训练方法及语音质量的检测方法在审
申请号: | 202110202612.9 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112967735A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 郑羲光;郑晓昊;邢文浩;罗必达;张晨;郭亮 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 苏银虹;朱志玲 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质量 检测 模型 训练 方法 | ||
本公开关于一种语音质量检测模型的训练方法及语音质量的检测方法,所述训练方法包括:获取语音信号样本和所述语音信号样本通过网络传输时的网络服务质量QoS数据样本;将所述语音信号样本的音频特征和所述网络QoS数据样本输入到所述语音质量检测模型,得到估计的语音质量分数;基于所述语音信号样本的真实语音质量分数和所述估计的语音质量分数,确定所述语音质量检测模型的损失函数;基于确定的损失函数,对所述语音质量检测模型进行训练。
技术领域
本公开涉及音频技术领域,更具体地说,涉及语音质量检测模型的训练方法和训练装置及语音质量的检测方法和检测装置。
背景技术
目前,音频信号客观质量评测可以分为两种方法,即完全参考方法和无参考方法。完全参考方法是将原始无损的语音信号和音质由于各种可能原因而降低的对应音频信号(即,被打分信号)作为输入信号,通过对比原始参考信号和对应的被打分信号,取得一个差距值,根据差距的大小来给定被打分信号的质量(即分数)。例如,PESQ和Polqa就是完全参考的语音质量评测方法。完全参考方法需要参考信号才能完成打分,无法应用于实时语音通信系统中的实时语音音质监控任务。另外,无参考方法是指不需要原始语音参考,直接对输入的音频信号进行打分。然而,相对于有参考打分方法,目前业界尚无广泛采纳的较成熟的无参考音频音质打分方法。
发明内容
本公开提供语音质量检测模型的训练方法和训练装置及语音质量的检测方法和检测装置,以至少解决上述相关技术中的问题,也可不解决任何上述问题。
根据本公开实施例的第一方面,提供一种语音质量检测模型的训练方法,包括:获取语音信号样本和所述语音信号样本通过网络传输时的网络服务质量QoS数据样本;将所述语音信号样本的音频特征和所述网络QoS数据样本输入到所述语音质量检测模型,得到估计的语音质量分数;基于所述语音信号样本的真实语音质量分数和所述估计的语音质量分数,确定所述语音质量检测模型的损失函数;基于确定的损失函数,对所述语音质量检测模型进行训练。
可选地,所述语音信号样本的音频特征可通过对所述语音信号样本进行时频变换而获得。
可选地,所述网络QoS数据可包括网络抖动率、网络丢包率、网络上下行带宽、网络延迟中的至少一个。
可选地,所述语音质量检测模型可包括卷积层、第一全连接层、门控循环单元层和第二全连接层;其中,所述将所述语音信号样本的音频特征和所述网络QoS数据样本输入到所述语音质量检测模型,得到估计的语音质量分数,可包括:将所述语音信号样本的音频特征输入所述卷积层,获得卷积后的特征向量;将所述卷积后的特征向量与所述网络QoS数据样本串联,得到串联特征;将所述串联特征输入第一全连接层,得到变换特征;将所述变换特征输入所述门控循环单元层,得到时序特征;将所述时序特征输入第二全连接层,得到所述估计的语音质量分数。
可选地,所述真实语音质量分数可以是预先标注好的所述语音信号样本在通过相应所述网络QoS数据样本条件下的网络传输后的语音信号的主观感知相关的语音质量分数。
可选地,所述基于所述语音信号样本的真实语音质量分数和所述估计的语音质量分数,确定所述语音质量检测模型的损失函数,可包括:计算所述真实语音质量分数和所述估计的语音质量分数的均方误差,作为所述损失函数。
根据本公开实施例的第二方面,提供一种语音质量的检测方法,包括:获取待检测语音信号和所述待检测语音信号通过网络传输时的实时网络服务质量QoS数据;将所述待检测语音信号的音频特征和所述实时网络QoS数据输入根据本公开的训练方法训练得到语音质量检测模型,得到针对所述待检测语音信号的语音质量分数。
可选地,所述待检测语音信号的音频特征可通过对所述待检测语音信号进行时频变换而获得。
可选地,所述实时网络QoS数据可包括实时网络抖动率、实时网络丢包率、实时网络上下行带宽、实时网络延迟中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110202612.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种重症监护用多功能呼吸罩
- 下一篇:一种制冷设备