[发明专利]基于退化分离估计技术的语音分离方法和系统在审
| 申请号: | 201980092422.7 | 申请日: | 2019-02-26 |
| 公开(公告)号: | CN113439304A | 公开(公告)日: | 2021-09-24 |
| 发明(设计)人: | 谢由页;毕相如;张青山;张国霞 | 申请(专利权)人: | 哈曼国际工业有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈尧剑 |
| 地址: | 美国康*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 退化 分离 估计 技术 语音 方法 系统 | ||
1.一种基于退化分离估计技术(DUET)的语音分离方法,其包括:
接收来自传声器的信号;
对接收的信号进行傅立叶变换;
计算每个数据点的相对衰减参数和相对延迟参数;
基于所述传声器之间的距离和所述传声器的采样频率选择所述相对延迟参数的聚类范围,
将所述相对延迟参数的所述聚类范围内的数据点聚类成子集,以及
对每个子集进行逆傅立叶变换。
2.如权利要求1所述的方法,其中选择所述相对延迟参数的所述聚类范围还基于语音中的最大频率。
3.如权利要求1所述的方法,其还包括将所述相对衰减的范围设置为常数。
4.如权利要求1-3中任一项所述的方法,其中所述相对延迟参数的所述聚类范围由下式给出:
其中fs是所述传声器的所述采样频率,d是所述传声器之间的所述距离,fmax是言语中的所述最大频率,c是声音的速度,并且n0是所述传声器在数据点方面的最大同步误差。
5.如权利要求1所述的方法,其还包括由扬声器生成同步声音以同步所述接收的信号。
6.如权利要求5所述的方法,其还包括从所述接收的信号中滤除所述同步声音。
7.如权利要求5所述的方法,其中所述同步声音是一次或周期性地生成的。
8.如权利要求5所述的方法,其中所述同步声音是超声波。
9.如权利要求1或5所述的方法,当并且从所述传声器接收的所述信号同步时,所述相对延迟参数的所述聚类范围由给出,其中fs是所述传声器的所述采样频率,d是所述传声器之间的所述距离,fmax是所述言语中的所述最大频率,c是所述声音的所述速度。
10.一种基于退化分离估计技术(DUET)的语音分离系统,其包括
录音模块,其被配置为存储从传声器接收的信号;
处理器,其被配置为
对接收的信号进行傅立叶变换;
计算每个数据点的相对衰减参数和相对延迟参数;
基于所述传声器之间的距离和所述传声器的采样频率选择所述相对延迟参数的聚类范围,
将所述相对延迟参数的所述聚类范围内的数据点聚类成子集,以及
对每个子集进行逆傅立叶变换。
11.如权利要求10所述的系统,其中所述处理器还被配置为基于语音中的最大频率选择所述相对延迟参数的所述聚类范围。
12.如权利要求10所述的系统,其中所述处理器还被配置为将所述相对衰减的范围设置为常数。
13.如权利要求10-12中任一项所述的系统,其中所述相对延迟参数的所述聚类范围由下式给出:
其中fs是所述传声器的所述采样频率,d是所述传声器之间的所述距离,fmax是言语中的所述最大频率,c是声音的速度,并且n0是所述传声器在数据点方面的最大同步误差。
14.如权利要求10所述的系统,其还包括扬声器,所述扬声器被配置为生成同步信号以同步从所述传声器接收的所述信号。
15.如权利要求14所述的系统,其还包括同步和滤波模块,所述同步和滤波模块被配置为将从所述传声器接收的所述信号与所述同步信号同步并从所述接收的信号中滤除所述同步信号。
16.如权利要求14所述的系统,其中所述同步声音是一次或周期性地生成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980092422.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:离子传导体、蓄电装置和离子传导体的制造方法
- 下一篇:喷嘴叶片





