[发明专利]一种音频信号处理方法及装置有效
| 申请号: | 201911034571.6 | 申请日: | 2019-10-29 |
| 公开(公告)号: | CN110931021B | 公开(公告)日: | 2023-10-13 |
| 发明(设计)人: | 张丝潆;彭俊清;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L17/14 | 分类号: | G10L17/14 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 音频 信号 处理 方法 装置 | ||
本申请公开一种音频信号处理方法及装置,其中,音频信号处理方法包括:获取存在截幅的第一音频信号;获取用于表示所述第一音频信号的截幅比例的目标数据;若所述目标数据属于目标范围,将所述第一音频信号划分为至少两个音频段;对所述至少两个音频段进行截幅检测处理,并根据所述截幅检测处理后的音频段,获得第二音频信号。采用本申请的技术方案,能够尽可能多地保留有效音频信号,使得音频信号的可使用率得到较大的提升。
技术领域
本发明涉及通信技术领域,尤其涉及一种音频信号处理方法及装置。
背景技术
在声纹识别过程中,音频信号的前期预处理十分关键,对后续的识别准确率有极大的影响。其中,前期预处理包括对音频信号的截幅检测。音频信号的截幅主要是由于音频信号的幅值过高,超过了采样值范围的最大值,从而出现了截幅,也叫截顶现象。
截幅会导致语音信号中的信息受损,现有技术中,一旦检测到一段语音信号存在截幅,就将该段语音信号丢弃,这种方式会导致很多有效语音信号的丢失。
发明内容
本发明实施例提供一种音频信号处理方法及装置,能够保留更多的有效音频信号,使得音频信号的可使用率得到较大的提升。
第一方面,本发明实施例提供了一种音频信号处理方法,包括:
获取存在截幅的第一音频信号,所述第一音频信号包括N个采样点,所述N为正整数;
获取用于表示所述第一音频信号的截幅比例的目标数据,所述截幅比例用于表示所述N个采样点中存在截幅的采样点的数量与所述N之间的比值;
若所述目标数据属于目标范围,将所述第一音频信号划分为至少两个音频段;
对所述至少两个音频段进行截幅检测处理,并根据所述截幅检测处理后的音频段,获得第二音频信号。
在一种可能的实现方式中,所述对所述至少两个音频段进行截幅检测处理,并根据所述截幅检测处理后的音频段,获得第二音频信号,包括:
针对所述至少两个音频段中的每个音频段,检测所述音频段是否存在截幅;
若所述音频段存在截幅,则将所述音频段丢弃;
获取所述至少两个音频段中所述丢弃后的剩余音频段;
根据所述剩余音频段,获得第二音频信号。
在一种可能的实现方式中,检测所述第二音频信号的音频长度是否大于或者等于第一阈值;
若所述第二音频信号的音频长度大于或者等于所述第一阈值,则确定所述第二音频信号为可用的音频信号;
若所述第二音频信号的音频长度小于所述第一阈值,则将所述第二语音信号丢弃。
在一种可能的实现方式中,所述至少两个音频段中的每个音频段包括至少一个采样点,所述检测所述音频段是否存在截幅,包括:
获取所述音频段包括的至少一个采样点中每个采样点的幅度值;
若所述至少一个采样点的幅度值满足第一条件,则确定所述音频段存在截幅,所述第一条件包括:连续第一数量或者连续大于第一数量的采样点的幅度值大于第二阈值。
在另一种可能的实现方式中,所述获取存在截幅的第一音频信号之前,还包括:
获取所述第一音频信号包括的N个采样点中每个采样点的幅度值;
若所述N个采样点的幅度值满足第一条件,则确定所述第一音频信号存在截幅,所述第一条件包括:连续第一数量或者连续大于第一数量的采样点的幅度值大于第二阈值。
在一种可能的实现方式中,所述N个采样点中每个采样点的幅度值属于目标采样范围;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911034571.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:养颜生发丸
- 下一篇:一种厂房内安全隐患危险等级的快速预估方法





