[发明专利]音频处理方法及装置有效
申请号: | 201410367980.9 | 申请日: | 2014-07-29 |
公开(公告)号: | CN104157287B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 刘淦明 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/10 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 李秀娟,郝传鑫 |
地址: | 510663 广东省广州市高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种音频处理方法及装置。
背景技术
当今社会快速发展,人们常常需要记录并回放各种有用语音信息,也常常通过互联网进行语音沟通。比如,人们在参加会议时,需要录下发言人的讲话,以便掌握更详细的信息;人们使用互联网聊天工具进行沟通时会发送微信语音、QQ语音等语音信息。目前,常用的录音方法是从录音开始至结束,录音设备记录录音期间所有的音频信息。
在实现本发明的过程中,发明人发现现有技术至少存在如下问题:
现有的录音记录方法把无用音频也记录了起来。无用音频是指包含无用信息的音频,例如录音期间没有人讲话的无声音频,或者是声音很小的非正常讲话的音频。这种无用音频浪费存储空间,回放的时候也浪费听者的时间,如果在网络传输还会浪费流量。
发明内容
本发明实施例的多个方面提出一种音频处理方法及装置,能够自动识别并删除无用音频,保存有用音频,从而节约了存储空间、回放的时间及音频通过网络传输时的数据流量。
本发明实施例的一个方面提供了一种音频处理方法,包括:
按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
当所述差值小于或等于所述音量差阈值时,保存所述音频;
当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;
当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
其中,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。所述修正系数是一个比1大的数,并且可以修改。
相应地,本发明实施例的另一个方面还提供了一种音频处理装置,包括:
取样模块,用于按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
第一判断模块,用于判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
第一保存模块,用于当所述差值小于或等于所述音量差阈值时,保存所述音频;
第二判断模块,用于当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
音频删除模块,用于当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;和,
第二保存模块,用于当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
其中,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值,所述修正系数是一个比1大的数,并且可以修改。实施本发明实施例,具有如下有益效果:
本发明实施例提供的音频处理方法及装置,对音频的音量进行取样,获得一组所述音频的音量取样值,再用所述音量取样值去判断音频是否是有用音频。然后把无用音频删除,仅保存有用音频,从而节约了音频的存储空间和听者回放的时间,如果音频在网络上传输,就也节约了网络流量。
附图说明
图1是本发明提供的音频处理方法的一个实施例的流程示意图;
图2是本发明提供的音频处理装置的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的音频处理方法的一个实施例的流程示意图,该方法包括步骤S101至S106,具体如下:
S101,按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
在一种实施方式中,所述音频可以是一段已经预先录制好的音频,假设所述音频的时长为10分钟,按取样频率f为20Hz对这段音频的音量进行取样,得到12000个所述音频的音量的取样值,即所述音频被平均分成了12000段音频单元,一个所述音量取样值对应一个所述音频单元。
S102,判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410367980.9/2.html,转载请声明来源钻瓜专利网。