[发明专利]一种基于空域相关性的二维时频掩模估计建模方法有效
申请号: | 201810955158.2 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109166590B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 许春冬;龙清华;应冬文;许瑞龙;周静 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 341000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空域 相关性 二维 时频掩模 估计 建模 方法 | ||
1.一种基于空域相关性的二维时频掩模估计建模方法,包括:
步骤一、将通过麦克风阵列接收到的声源信号转换为数字信号处理,所述的麦克风阵列包括K对麦克风;
步骤二、将混合语音信号通过子带滤波器处理分解为不同的时频单元;
步骤三、计算在给定相同时间和相同频点情况下M对麦克风阵列之间的相位差,所述M等于K(K-1)/2,K表示阵列拥有麦克风的数量;
步骤四、计算在假设某频点被目标声源支配的情况下,M对麦克风之间的相位差;
步骤五、根据以上步骤三、步骤四两种情况下计算出的两个相位差定义频点到目标声源的距离;
步骤六、采用类比于正态分布的方法定义频点被目标声源支配的概率;
步骤七、将支配转移概率的马尔可夫链在时间维度和频率维度进行分解分析,表示出时间转移概率,频率转移概率;
步骤八、根据时间维度状态相关特性和频率维度状态相关特性进行交织建模并画出示意图;
步骤九、根据以上二维交织建模表示出模型的整个参数集;
步骤十、计算全局的概率密度函数,将建模问题实现为按极大似然准则估计整体参数集;
步骤十一、将参数集的估计过程等价为以模型为基础的分类过程。
2.如权利要求1所述的一种基于空域相关性的二维时频掩模估计建模方法,在步骤三中,所述计算在给定相同时间和相同频点情况下M对麦克风阵列之间的相位差的操作包括:
在给定t时刻和f频点上,由第p个和第q个麦克风组成的第m(m=1,2,…,M)对麦克风的相位差ψl,m为:
其中∠(.)表示求取复数相位的操作,m表示麦克风的索引;l为帧号;m1和m2分别表示第1对和第2对麦克风;和分别表示第m1和m2个麦克风第l帧的对数幅度谱;
在阵列中共有K对麦克风,则对于某个给定的时频点,总共有M=K(K-1)/2对麦克风上的相位差组成一个向量集,以此表示声源的空域特征。
3.如权利要求1所述的一种基于空域相关性的二维时频掩模估计建模方法,在步骤四中,所述计算在假设某频点被目标声源支配的情况下,M对麦克风之间的相位差包括:
在t时刻和f频点相同的情况下,假设此时频点完全被目标声源所支配;
通过几何关系推导出此条件下的麦克风之间相位差为:
其中,三维单位矢量γ表示声源的入射方向,rk表示声源的间距,c表示声速,表示周期为T的第k个麦克风到第一个麦克风之间的单位矢量;l为帧号;m表示麦克风的序号;ωf表示角频率;T=2π/ωf。
4.如权利要求1所述的一种基于空域相关性的二维时频掩模估计建模方法,在步骤五中根据步骤三、步骤四求出的两个相位差定义频点到目标声源的距离L(Xl,f,γ)包括:
将一般时频点和被完全支配频点相位差进行取绝对值操作;“一般时频点”表示其相位差为ψl,m,的频点;“被完全支配的频点”表示其相位差为的频点;
求取上面步骤中相位差绝对值的平方和,然后进行累加,最后再除以总项数得到均值;此均值类似于正态分布中的均值μ;
求得新定义的(l,f)频点到目标声源的距离L(Xl,f,γ)为:
其中F(·)表示将周期为2π的变量调整到[-π,π]之间的函数,ωf表示角频率。参数l为帧号;Xl,f,γ表示入射方向为γ的第l帧,第f个频点信号的对数幅度谱;m表示麦克风的序号;ψl,m表示相位差;rm表示第m对麦克风之间的间距;表示周期为T的第m个麦克风到第一个麦克风的单位矢量;γ表示声源的入射方向;c表示速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810955158.2/1.html,转载请声明来源钻瓜专利网。