[发明专利]一种音频信号处理的方法及装置有效

申请号：	201911103069.6	申请日：	2019-11-12
公开（公告）号：	CN110827798B	公开（公告）日：	2020-09-11
发明（设计）人：	盘子圣;丁宁	申请（专利权）人：	广州欢聊网络科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/08;G10L19/02;G10L25/03;G10L25/30;G10L25/45;G10L25/51;G06N3/04;G06N3/08
代理公司：	广州佳睿知识产权代理事务所(普通合伙) 44610	代理人：	李健富;朱彩银
地址：	510000 广东省广州市天***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频信号处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种音频信号处理的方法及装置，其中该方法包括：对待测音频进行预处理，获得多维梅尔频谱特征序列；将该多维梅尔频谱特征序列切片后输入已训练的音频识别模型，并获得该音频识别模型输出的各音频片段对应的预测概率，该预测概率为预测该音频片段存在指定类型的音频的概率，该音频片段具有指定时长，该指定类型的音频包括无具体语义的音频信号；根据获得的多个预测概率，生成二分类序列，其中，该二分类序列中各序列元素与指定时长的音频片段对应；根据该指定时长，从该二分类序列中确定该指定类型的音频处于该待测音频中的时间信息。本申请可以提高指定类型的音频的识别准确度，同时可以提升识别效率。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种音频信号处理的方法及装置。

背景技术

随着互联网技术的发展，信息的传播的方式和渠道发生显著变化。而网络上传播的信息种类很多，其中有可能会涉及色情影片的传播。因此，为了净化网络环境，需要对传播的信息进行审核。

例如，对于网上发布的音频节目，可以通过语音识别算法将音频转换成文字内容来进行涉黄识别，但音频节目中还有很多是没有语义信息的，比如娇喘，从而导致漏检，识别的准确率不高。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种音频信号处理的方法及装置。

第一方面，本申请提供了一种音频信号处理的方法，所述方法包括：

对待测音频进行预处理，获得多维梅尔频谱特征序列；

将所述多维梅尔频谱特征序列切片后输入已训练的音频识别模型，并获得所述音频识别模型输出的各音频片段对应的预测概率，所述预测概率为预测该音频片段存在指定类型的音频的概率，所述音频片段具有指定时长，所述指定类型的音频包括无具体语义的音频信号；

根据获得的多个预测概率，生成二分类序列，其中，所述二分类序列中各序列元素与指定时长的音频片段对应；

根据所述指定时长，从所述二分类序列中确定所述指定类型的音频处于所述待测音频中的时间信息。