[发明专利]一种从音频中提取目标源的方法及装置有效
申请号: | 201710816430.4 | 申请日: | 2017-09-12 |
公开(公告)号: | CN107578784B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 郑羲光;尚梦宸;刘飞 | 申请(专利权)人: | 音曼(北京)科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/48;G10L25/78 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 100029 北京市朝阳区日坛北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 提取 目标 方法 装置 | ||
本发明公开一种从音频中提取目标源的方法及装置。方法包括:对采集的音频信号逐帧进行时频变换,将时域信号变换为频域信号,利用窗函数对频域信号进行分割形成两路信号;遍历计算给定频率下每帧频域信号的两路信号各频点对应的虚拟源的虚拟夹角;比较虚拟夹角与预定角度阈值的大小,根据比较结果将一个信号作为目标源信号并提取该目标源信号的频域信号存储;利用时频逆变换将存储的目标源信号的频域信号转换为时域信号,输出目标源时域信号。本发明实现了将目标源信号从音频信号中分离。
技术领域
本发明涉及音频信号处理技术领域,具体涉及一种从音频中提取目标源的方法及装置。
背景技术
目前KTV市场上的唱歌打分系统大部分是以演唱的音调起伏或是音量大小来评分的,不能真正根据演唱者的声音进行评分,这种低精度的评分系统正越来越无法满足消费者的需求。试想一个唱歌非常好听的人和一个唱歌不是那么好的人他们分数相同,或者因为音量的关系唱的不好的人分数反而很高,这样的打分大大降低的一部分人的评分积极性。所以对于KTV评分系统的改进变得非常重要,为了改善KTV评分系统,使评分变得更加精准,我们可以用歌曲中原唱的人声对比消费者在KTV演唱的人声,二者的吻合度越高则评分就会越高。而这样做的第一步则是将歌曲中的原唱人声从歌曲的伴奏加人声中单独提取出来,然而如何从自包含有人声与伴奏的歌曲音频中将原唱的人声很好地提取出来,成为难题。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种从音频中提取目标源的方法及装置。
为实现本发明的目的所采用的技术方案是:
一种从音频中提取目标源的方法,包括步骤:
对采集的音频信号逐帧进行时频变换,将时域信号变换为频域信号,利用窗函数对频域信号进行分割,形成第一路信号与第二路信号;
遍历计算给定频率下每帧频域信号的第一路信号与第二路信号的各频点对应的虚拟源的虚拟夹角;
比较所述虚拟夹角与预定角度阈值的大小,根据比较结果将第一路信号或第二路信号作为目标源信号并提取该目标源信号的频域信号存储;
利用时频逆变换将存储的目标源信号的频域信号转换为时域信号,输出目标源时域信号。
本发明的另一方面还在于提供一种从音频中提取目标源的装置,包括:
时域频域转化分割模块,用于对采集的音频信号逐帧进行时频变换,将时域信号变换为频域信号,利用窗函数对频域信号进行分割,形成第一路信号与第二路信号;
虚拟夹角计算模块,用于遍历计算给定频率下每帧频域信号的第一路信号与第二路信号的各频点对应的虚拟源的虚拟夹角;
目标源信号存储模块,用于比较所述虚拟夹角与预定角度阈值的大小,根据比较结果将第一路信号或第二路信号作为目标源信号并提取该目标源信号的频域信号存储;
频域时域转化输出模块,用于利用时频逆变换将存储的目标源信号的频域信号转换为时域信号,输出目标源时域信号。
本发明方法通过将待分离音频信号逐帧进行时域频域转化后,分别形成第一路信号与第二路信号,然后通过遍历计算频率下每帧频域信号的第一路信号与第二路信号的各频点对应的虚拟源的虚拟夹角,根据该虚拟夹角与预定角度阈值比较,实现将符合要求的目标源信号分离出来存储,之后再经过频域到时域的转化后输出,实现将目标源信号自音频信号中分离提取出来,方便后续对目标源信号的处理使用。
附图说明
图1是从音频中提取目标源的方法的流程图;
图2是虚拟源的虚拟夹角的计算示意图;
图3是从音频中提取目标源的装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于音曼(北京)科技有限公司,未经音曼(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710816430.4/2.html,转载请声明来源钻瓜专利网。