[发明专利]一种用于声源分离的编解码方法有效

申请号：	201310160493.0	申请日：	2013-05-03
公开（公告）号：	CN103236264A	公开（公告）日：	2013-08-07
发明（设计）人：	吴钊	申请（专利权）人：	湖北文理学院
主分类号：	G10L21/0272	分类号：	G10L21/0272;G10L19/00
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	严彦
地址：	441053 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于声源分离解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于声源分离的编码方法，其特征在于：对参考信息进行编码，包括获取每个声源和下混信号每个声道的时频变换系数，并按帧和频率排列构成二维时频图；根据活跃声源数遍历每一种活跃声源的组合方案并求得对应的备选解；计算各备选解的失真，取失真最小的备选解所对应的组合的标号作为声源分离的参考信息；根据下混信号判定参考信息的重要性；根据重要性重新组织参考信息；最后对重新组织的参考信息进行熵编码得到参考信息码流。

2.根据权利要求1所述用于声源分离的编码方法，其特征在于：根据活跃声源数遍历每一种活跃声源的组合并求得对应的备选解，实现方法如下，

首先，根据事先设定的活跃声源数K，V≤K≤U，且V＜U，遍历在U个声源中选出K个活跃声源所有的W=KU]]>种组合方案，并记这W个组合方案为O₁,O₂,...,O_W，其下标采用的标号称为活跃声源组合指标；

然后，在时频点(t,f)处求所有组合方案O₁,O₂,...,O_W下声源分离问题的解S_w(t,f)，w＝1,2,...,W，S_w(t,f)是一个U维声源矢量，分三种情况求解，

(a)K＝V，在每个组合方案O_w下，声源混合方程A(t,f)S(t,f)^T=X(t,f)^T有唯一的解，这个解为S_w(t,f)，通过线性方程组解法得到，其中A(t,f)为下混矩阵，S(t,f)为待求的声源矢量，X(t,f)为下混信号矢量，^T表示转秩；

(b)V＜K＜U，在每个组合方案O_w下，声源混合方程A(t,f)S(t,f)^T=X(t,f)^T有无穷多解，从中选取一个解作为S_w(t,f)，选取S_w(t,f)=E[S(t,f)|X(t,f)]时，E[S(t,f)|X(t,f)]表示满足下混方程解S(t,f)在后验概率分布P(S(t,f)|X(t,f))下数学期望；

(c)K＝U，此时W＝1，仅有一个组合方案，声源混合方程A(t,f)S(t,f)^T=X(t,f)^T有无穷多解，从中选取一个解作为S_w(t,f)，选取S_w(t,f)=E[S(t,f)|X(t,f)]时，E[S(t,f)|X(t,f)]表示满足下混方程解S(t,f)在后验概率分布P(S(t,f)|X(t,f))下数学期望。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于湖北文理学院，未经湖北文理学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310160493.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种省钱型移动支付方法
下一篇：抗饱和的SAR原始数据BAQ压缩动态解码方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于声源分离的编解码方法有效

专利文献下载