[发明专利]用于语音增强的方法和系统在审
| 申请号: | 201780096792.9 | 申请日: | 2017-11-23 |
| 公开(公告)号: | CN111344778A | 公开(公告)日: | 2020-06-26 |
| 发明(设计)人: | 张国霞;毕相如 | 申请(专利权)人: | 哈曼国际工业有限公司 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L21/0272;H04R3/00 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 高巍 |
| 地址: | 美国康*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 语音 增强 方法 系统 | ||
1.一种用于语音增强的系统,包括:
时间同步单元,所述时间同步单元被配置为对从至少两个麦克风发送的麦克风信号进行同步;
源分离单元,所述源分离单元被配置为分离同步的麦克风信号并输出分离出的语音信号,所述分离出的语音信号对应于语音源;以及
降噪单元,所述降噪单元包括:被配置为提取所述分离出的语音信号的语音特征的特征提取单元,和被配置为接收所述语音特征并输出清晰的语音特征的神经网络。
2.如权利要求1所述的系统,其中所述时间同步单元、所述源分离单元和所述降噪单元被包括在车辆的音响主机中。
3.如权利要求1或2所述的系统,其中所述至少两个麦克风中的一个被提供在便携式装置中。
4.如权利要求1至3中任一项所述的系统,其中所述时间同步单元被配置为通过检测所述麦克风信号的能量来使所述麦克风信号同步。
5.如权利要求1至4中任一项所述的系统,其中所述源分离单元被配置为多次执行聚类算法以获得多个聚类结果,并从所述多个聚类结果中选择最佳结果。
6.如权利要求1至5中任一项所述的系统,其中所述系统还包括再取样模块,所述再取样模块用于在所述麦克风信号的同步之前或之后对所述麦克风信号中的至少一个再取样。
7.如权利要求1至6中任一项所述的系统,其中所述神经网络中的模型是通过以下操作事先确定:
获取训练数据的集合;
提取所述训练数据的语音特征;
为所述神经网络确定起始参数的集合;以及
根据训练数据的所述语音特征和所述起始参数来迭代地训练所述神经网络的参数。
8.如权利要求1至7中任一项所述的系统,其中所述神经网络是受监督的深度神经网络。
9.如权利要求3至8中任一项所述的系统,其中所述便携式装置与所述音响主机是同步的。
10.一种语音增强方法,所述语音增强方法包括:
对从至少两个麦克风发送的麦克风信号进行同步;
分离同步的麦克风信号并输出分离出的语音信号,所述分离出的语音信号对应于语音源;
提取所述分离出的语音信号的语音特征;以及
通过神经网络将所述语音特征映射到清晰的语音特征。
11.如权利要求10所述的方法,其中在车辆的音响主机中执行所述同步、分离、提取和映射。
12.如权利要求10或11所述的方法,其中所述至少两个麦克风中的一个被提供在便携式装置中。
13.如权利要求10至12中任一项所述的方法,其中时间同步单元被配置为通过检测所述麦克风信号的能量来使所述麦克风信号同步。
14.如权利要求10至13中任一项所述的方法,其中源分离单元被配置为多次执行聚类算法以获得多个聚类结果,并从所述多个聚类结果中选择最佳结果。
15.如权利要求10至14中任一项所述的方法,所述方法还包括在所述麦克风信号的同步之前或之后对所述麦克风信号中的至少一个再取样。
16.如权利要求10至15中任一项所述的方法,其中通过以下操作来事先确定所述神经网络中的模型:
获取训练数据的集合;
提取所述训练数据的语音特征;
为所述神经网络确定起始参数的集合;以及
根据训练数据的所述语音特征和所述起始参数来迭代地训练所述神经网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780096792.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:热电转换装置
- 下一篇:无线通信系统及无线基站





