[发明专利]一种音频失真的检测方法及装置有效

申请号：	201410385151.3	申请日：	2014-08-06
公开（公告）号：	CN104167209B	公开（公告）日：	2017-06-13
发明（设计）人：	郝红霞;刘晓清	申请（专利权）人：	华为软件技术有限公司;清华大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L25/60
代理公司：	北京同达信恒知识产权代理有限公司11291	代理人：	冯艳莲
地址：	210012 江苏省南京***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频失真检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频分析技术领域，尤其涉及一种音频失真的检测方法及装置。

背景技术

目前各个运营商提供的音频分享平台中有着数百万的音频文件，例如：彩铃、振铃及歌曲等等，并且这些音频文件已经被数亿人口使用。然而，在使用过程中，用户会反馈某些音频有失真的问题。但是目前，运营商无法在音频分享平台中数百万的音频文件中识别出有问题的音频文件。

出现以上这个问题主要是因为音频提供商的音频编辑人员的工作失误引起的，并且这个问题是会严重影响用户的体验。

目前音频提供商并不能获知有问题的音频文件，也就无法对有问题的音频文件进行更新，从而导致运营商无法对音频提供商提供的音频文件进行质量把关，因此降低了音频的质量，进而影响了用户的体验。

发明内容

本发明实施例提供一种音频失真的检测方法及装置，用以解决现有技术中存在的运营商无法从海量音频文件中识别出有问题的音频文件、且无法对音频提供商提供的音频文件进行质量把关，从而导致音频质量降低的问题。

第一方面，本发明实施例提供了一种音频信号失真的检测方法，包括：

获取待检测音频信号的幅值的均值的第一绝对值；

若所述第一绝对值大于第一阈值，确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真。

结合第一方面，在第一方面的第一种可能的实现方式中，获取待检测音频信号的幅值的均值的第一绝对值后，所述方法还包括：

对所述待检测音频信号进行低频噪声滤除；

获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值，并

按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理；

获取分帧后各帧中包含的音频信号的最大幅值及最小幅值；

针对分帧后的每一帧，确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差，并针对各帧分别确定的差值求平均值；

确定分别由在每一帧获取的最大幅值构成的最大幅值序列，和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数；

确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真，包括：

根据所述第二绝对值、所述平均值和所述相关系数，确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，根据所述第二绝对值、平均值及相关系数，确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真，包括：

若所述第二绝对值大于第一阈值、或者所述第二绝对值不大于第一阈值且所述平均值不小于第二阈值、或者所述第二绝对值不大于第一阈值且所述相关系数不大于第三阈值，则确定所述待检测音频信号存在幅值不对称失真；

若所述第二绝对值不大于第一阈值、且所述平均值小于第二阈值且所述相关系数大于第三阈值，则确定所述待检测音频信号存在低频噪声失真。

结合第一方面和第一方面的第一种至第二种可能的实现方式中的任意一种，在第一方面的第三种可能的实现方式中，所述获取待检测音频信号的幅值的均值的第一绝对值之前，还包括：

获取音频信号文件；

确定播放所述音频信号文件所占用的时长大于预定的时间长度时，将所述音频信号文件进行分段处理，得到各段音频信号分别作为待检测音频信号。

结合第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，所述方法还包括：

若所述第一绝对值不大于第一阈值，确定所述待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。

结合第一方面的第四种可能的实现方式，在第一方面的第五种可能的实现方式中，所述方法还包括：

针对每一段待检测音频信号，分别执行：

若确定该待检测音频信号存在幅值不对称失真时，为该待检测音频信号标记用于表示幅值不对称失真的第一常数；

若确定该待检测音频信号存在低频噪声失真时，为该待检测音频信号标记用于表示低频噪声失真的第二常数；

若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真时，为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。

结合第一方面的第五种可能的实现方式，在第一方面的第六种可能的实现方式中，所述方法还包括：

针对获取的音频信号文件分段得到的各段待检测音频信号，确定为各段待检测音频信号分别标记的常数值的平均值；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为软件技术有限公司;清华大学，未经华为软件技术有限公司;清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410385151.3/2.html，转载请声明来源钻瓜专利网。

上一篇：基于分层事件检测和上下文模型的多源场景声音摘要方法
下一篇：带桩帽的空心墩台基础及其施工方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种音频失真的检测方法及装置有效

专利文献下载