[发明专利]音频去重方法及装置有效
| 申请号: | 201810146085.2 | 申请日: | 2018-02-12 | 
| 公开(公告)号: | CN108428457B | 公开(公告)日: | 2021-03-23 | 
| 发明(设计)人: | 田超 | 申请(专利权)人: | 北京百度网讯科技有限公司 | 
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/57;G06F16/61 | 
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 | 
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 音频 方法 装置 | ||
1.一种音频去重方法,其特征在于,包括:
获取待比对音频的特征信息;所述特征信息为所述待比对音频在频域上各个时间点以及各个频率点对应的特征值;
根据所述待比对音频的特征信息,采用倒排索引方法查询音频库,获取所述待比对音频对应的候选音频的特征信息;
针对各个候选音频,获取所述候选音频的特征信息中的各个候选片段,以及所述待比对音频的特征信息中的各个待比对片段;
将所述各个待比对片段与所述各个候选片段进行比对,确定与所述各个待比对片段对应的相似候选片段;其中,所述相似候选片段为,对应的低频段与待比对片段的低频段相似,且对应的高频段与待比对片段的高频段相似的候选片段;
根据与所述各个待比对片段对应的相似候选片段,确定所述候选音频是否为与所述待比对音频对应的相似候选音频;
在所述候选音频为与所述待比对音频对应的相似候选音频时,对所述待比对音频进行去重操作。
2.根据权利要求1所述的方法,其特征在于,所述将所述各个待比对片段与所述各个候选片段进行比对,确定与所述各个待比对片段对应的相似候选片段,包括:
对所述各个待比对片段在频率维度上进行划分,获取待比对低频片段和待比对高频片段;
对所述各个候选片段在频率维度上进行划分,获取候选低频片段和候选高频片段;
将所述各个待比对低频片段与所述各个候选低频片段进行比对,确定与所述各个待比对低频片段对应的相似候选低频片段;
针对各个待比对片段,获取对应的相似候选低频片段所对应的候选高频片段,将所述候选高频片段与所述待比对片段中的待比对高频片段进行比对,确定与所述各个待比对片段对应的相似候选片段。
3.根据权利要求2所述的方法,其特征在于,所述对所述各个待比对片段在频率维度上进行划分,获取待比对低频片段和待比对高频片段之前,还包括:
获取所述待比对音频的背景音和前景音,以及所述候选音频的背景音和前景音;
判断所述待比对音频的背景音与所述候选音频的背景音是否相同,以及判断所述待比对音频的前景音与所述候选音频的前景音是否相同;
确定所述待比对音频的背景音与所述候选音频的背景音相同,且所述待比对音频的前景音与所述候选音频的前景音不同。
4.根据权利要求2所述的方法,其特征在于,所述将所述各个待比对低频片段与所述各个候选低频片段进行比对,确定与所述各个待比对低频片段对应的相似候选低频片段之后,还包括:
针对各个待比对片段,对所述待比对片段在时间维度上进行划分,获取各个待比对子片段;
对包括对应的相似候选低频片段的候选片段,在时间维度上进行划分,获取各个候选子片段;所述待比对子片段的时间长度等于所述候选子片段的时间长度;
将所述待比对子片段与相应的候选子片段进行比对,获取所述待比对子片段与相应的候选子片段之间的相似度;
根据所述待比对子片段与相应的候选子片段之间的相似度,确定与所述待比对片段对应的相似候选片段。
5.根据权利要求1所述的方法,其特征在于,所述音频库中包括有:各个索引片段,以及包括所述索引片段的音频的特征信息;
所述根据所述待比对音频的特征信息,采用倒排索引方法查询音频库,获取所述待比对音频对应的候选音频的特征信息,包括:
根据所述待比对音频的特征信息,查询所述音频库,获取与所述待比对音频匹配的索引片段;
将包括所述匹配的索引片段的音频,确定为所述待比对音频对应的候选音频;
获取所述候选音频的特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810146085.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音降噪算法
 - 下一篇:一种声乐学习电子辅助发音系统
 





