[发明专利]一种从音频中提取目标源的方法及装置有效
| 申请号: | 201710816430.4 | 申请日: | 2017-09-12 |
| 公开(公告)号: | CN107578784B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 郑羲光;尚梦宸;刘飞 | 申请(专利权)人: | 音曼(北京)科技有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/48;G10L25/78 |
| 代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
| 地址: | 100029 北京市朝阳区日坛北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 音频 提取 目标 方法 装置 | ||
1.一种从音频中提取目标源的方法,其特征在于,包括步骤:
对采集的音频信号逐帧进行时频变换,将时域信号变换为频域信号,利用窗函数对频域信号进行分割,形成第一路信号与第二路信号;
遍历计算给定频率下每帧频域信号的第一路信号与第二路信号的各频点对应的虚拟源的虚拟夹角;
比较所述虚拟夹角与预定角度阈值的大小,根据比较结果将第一路信号或第二路信号作为目标源信号并提取该目标源信号的频域信号存储;
利用时频变换逆变换将存储的目标源信号的频域信号转换为时域信号,输出目标源时域信号;
所述虚拟源的虚拟夹角的计算方式如下:
θab(k)表示频率k呈现的第一路信号a与第二路信号b的各频点对应的虚拟源的虚拟夹角,Aa(k)与Ab(k)分别表示第一路信号a与第二路信号b呈现的频率k的振幅,表示第一路信号a与第二路信号b的夹角。
2.如权利要求1所述从音频中提取目标源的方法,其特征在于,当所述虚拟源的虚拟夹角大于预定角度阈值时,将所述虚拟源所对应的第一路信号或第二路信号视为目标源信号,然后提取该目标源信号的频域信号存储。
3.如权利要求1所述从音频中提取目标源的方法,其特征在于,若第一路信号a为目标源信号,则提取该目标源信号的计算方式如下:
S(k)=Aa(k)·M(k),
其中,
M(k)为目标源信号提取向量;T为给定阈值,S(k)为目标源信号。
4.一种从音频中提取目标源的装置,其特征在于,包括:
时域频域转化分割模块,用于对采集的音频信号逐帧进行时频变换,将时域信号变换为频域信号,形成第一路信号与第二路信号;
虚拟夹角计算模块,用于遍历计算给定频率下每帧频域信号的第一路信号与第二路信号的各频点对应的虚拟源的虚拟夹角;
目标源信号存储模块,用于比较所述虚拟夹角与预定角度阈值的大小,根据比较结果将第一路信号或第二路信号作为目标源信号并提取该目标源信号的频域信号存储;
频域时域转化输出模块,用于利用时频变换逆变换将存储的目标源信号的频域信号转换为时域信号,输出目标源时域信号;
所述虚拟源的虚拟夹角的计算方式如下:
θab(k)表示频率k呈现的第一路信号a与第二路信号b的各频点对应的虚拟源的虚拟夹角,Aa(k)与Ab(k)分别表示第一路信号a与第二路信号b呈现的频率k的振幅,表示第一路信号a与第二路信号b的夹角。
5.如权利要求4所述从音频中提取目标源的装置,其特征在于,当所述虚拟源的虚拟夹角大于预定角度阈值时,将所述虚拟源所对应的第一路信号或第二路信号视为目标源信号,然后提取该目标源信号的频域信号存储。
6.如权利要求4所述从音频中提取目标源的装置,其特征在于,若第一路信号a为目标源信号,则提取该目标源信号的计算方式如下:
S(k)=Aa(k)·M(k),
其中,
M(k)为目标源信号提取向量;T为给定阈值,S(k)为目标源信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于音曼(北京)科技有限公司,未经音曼(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710816430.4/1.html,转载请声明来源钻瓜专利网。





