[发明专利]一种针对VoIP语音的客观评测方法无效
| 申请号: | 200910235644.8 | 申请日: | 2009-10-10 |
| 公开(公告)号: | CN102044247A | 公开(公告)日: | 2011-05-04 |
| 发明(设计)人: | 杨越;谢湘;魏耀都 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/12;H04M7/00 |
| 代理公司: | 北京理工大学专利中心 11120 | 代理人: | 张利萍;高燕燕 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 voip 语音 客观 评测 方法 | ||
技术领域
本发明涉及通信网络质量的评测方法领域,尤其是针对VoIP语音的一种客观评测方法。
背景技术
目前对于语音质量的测试方法有两种:传统的主观评测方法和新的客观评测方法。主观评测是以人为主体来评价语音和语音的质量。在语音质量主观评测方法中,MOS(平均意见分:Mean Option Score)评分的使用最为广泛,它以平均意见分来衡量语音质量,用五个等级来表示语音的质量等级:优(5分)、良(4分)、一般(3分)、差(2分)、坏(1分)。主观听音测试方法包括:1).ACR(Absolute Category Rating):绝对等级评定,这是最常用的一种基于语句组的听音测试方法,语句组由一组无关的短句组成,每一个语句都通过一系列的标准处理;2).DCR(Degradation Category Rating):衰减等级评定,用于小衰减情况,适于评价类似的数字语音处理算法、系统优化;3).CCR(Comparison CategoryRating):比较等级评定,用于改进输入语音质量,如加噪等。4).QRDM(Quanta-Response Detectbility Method):定量响应可检测性方法,用于定量分析;5).TM(Threshold Method):门限方法主观评价的优点是符合人对语音质量的感觉,缺点是费时费力费钱,且灵活性不够,重复性和稳定性较差,受人的主观影响较大等。因此以计算机信息处理为核心的语音质量客观评价成为大家关注的热点技术。
客观评测方法主要有以下两种:一是ITU-T P.862(感知语音质量评测),又称为PESQ(Perceptual Evaluation of Speech Quality)建议,它是ITU提出的语音质量客观评价算法之一,针对网络中出现的可变时间延迟和系统引入的线性滤波这两方面做了改进,是目前与主观分值相关度最高的语音质量评测客观算法。其主客观相关度可达到0.935,分值在0~4.5之间,通常情况下输出分值在1.0~4.5之间。当分值在2分或2分以下时,表示语音质量比较差,难于听懂。然而这种算法不能很好地评测对话语音质量,并且PESQ的听觉变换和扰动处理是基于帧到帧的比较,也就不能很好地处理VoIP的网络编解码器和自适应抖动缓冲处理器对于语音的一些优化,不能给出与主观分值相关度比较高的客观分值。另一种客观评测算法是在网络规划中获得了广泛应用的ITU-T G.107规范(E模型)。其优点是全面考虑了网络中的网络损伤因素,如噪声回音延时编码器性能抖动等,给出一个单一的具有相当的评估准确度的得分R,且其质量等级R值与客观MOS分的质量等级存在一个非线性单调的映射关系,也可用于对话测试。然而E模型却存在如下缺点:首先,对于大数量的可能输入参数的组合情况未经过足够的界内验证和充分的实验室测量,估测仍处在置疑和研究的阶段;其次,它简单地认为单个质量损伤因素(如静音回声延时和失真)是相互独立的,都采用同样的尺度来衡量;再次,其前提是假设语音质量损伤因素总是物理附加的,但研究表明这种假设的可靠性在某些情况下存在疑问;另外,它建立在300Hz-3400Hz电话语音带宽的基础上,不能准确地用于宽带语音的质量评定等。因此,目前使用比较广泛的语音客观评测算法还是感知语音质量评测——PESQ,但是它不能很好的评测经过了网络编解码器和自适应抖动缓冲器的语音,并且实验证明,其获得的主客观相关度特别的低。
发明内容
本发明要解决的技术问题是,提供一种针对VoIP语音的客观评测方法,能够客观评测现有的由编解码器、丢包、噪声等引入损伤的语音质量,而且能够客观评测网络编解码器、自适应抖动缓冲器、以及端到端的延时抖动造成的失真语音的质量。
为此,本发明提供的针对VoIP语音的客观评测方法,包括:
第一步:在VoIP的发送端获得原始语音;
第二步:在接收端获得引入损伤的失真语音;
第三步:通过预处理模块划分原始语音和失真语音,得到语句信息,并且判断失真语音中是否有拉伸或压缩语句,得到拉伸或压缩信息;
第四步:利用编解码器损伤评估模块A计算对齐语句的编解码器损伤,利用编解码器损伤评估模块B计算有拉伸或压缩的语句的质量损伤,利用延时损伤评估模块评测端到端延时和内部的延时对语音的影响;
第五步:利用拟合模块最终得到语音质量客观评测分值。
所述的发送端和接收端为固定电话、移动电话或者IP终端计算机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910235644.8/2.html,转载请声明来源钻瓜专利网。





