[发明专利]语音增强方法有效
申请号: | 201210008319.X | 申请日: | 2012-01-09 |
公开(公告)号: | CN103000183A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 廖宪正 | 申请(专利权)人: | 财团法人工业技术研究院 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 梁挥;常大军 |
地址: | 中国台湾新竹*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 | ||
技术领域
本发明涉及语音增强(speech enhancement)技术。
背景技术
语音增强技术是一种将接收到的语音信号予以滤除不必要的噪音干扰以增强该语音内容的方法。其可使用于语音通讯、语音人机界面(user voice interface)、语音输入(voice input)及其它各种应用。近年来,随着各种移动装置、车用电子和机器人的快速发展,在具有噪音干扰的环境中进行语音通讯、语音输入或语音人机互动的机率日渐提高,如何滤除噪声以增强语音内容,提高语音通讯或语音人机互动的质量,成为此领域的重要课题。
一般而言,通过麦克风所撷取到的语音信号,均包含了目标音源和干扰音源。该干扰音源会造成语音通讯或语音人机互动的困难度升高。为提升语音通讯或语音人机互动的质量,势必需要降低干扰音源对整体声音信号所造成的干扰。先前许多语音增强技术使用了滤波器、适应性滤波器、统计模型等方法,结合单一麦克风来进行语音增强,然其效能均有其限制。近年来,使用多麦克风进行语音增强的技术因其效能普遍来说,较使用单一麦克风较佳,因此开始受到重视。然而,该类技术所需运算量较大,通常无法使用在运算资源受到限制的移动装置上。因此,一搭配麦克风阵列且运算相对简单的语音增强方法,而仍能达成有效降低干扰音源的目的,将会成为极具价值的发明。本发明即提供该语音增强方法。
发明内容
本发明的目的在于揭示一种语音增强方法,搭配麦克风阵列且运算相对简单的语音增强方法,能达成有效降低干扰音源的目的。
为了达到上述目的,本发明揭示一种语音增强方法,包含下列步骤:利用一麦克风阵列接收多个音框的声音信号;计算各音框的声音信号于各频段对应该多个麦克风中的至少一双麦克风组合的两耳时间差(inter-aural time difference);根据该计算结果统计各音框的声音信号的两耳时间差的累积直方图(cumulative histogram);根据该些累积直方图计算一第一两耳时间差门坎值;以及根据该第一两耳时间差门坎值过滤该些音框的声音信号。
本发明还揭示一种语音增强系统,包含一麦克风阵列、一累积直方图模块、一第一两耳时间差门坎值计算模块以及一声音信号过滤模块。该两耳时间差计算模块用以计算各音框的声音信号于各频段对应该多个麦克风中的至少一双麦克风组合的两耳时间差。该累积直方图模块用以计算各音框两耳时间差的累积直方图。该第一两耳时间差门坎值计算模块用以计算基于累积直方图的第一两耳时间差门坎值。该声音信号过滤模块用以过滤基于第一两耳时间差门坎值的声音信号。
本发明还揭示一种语音增强方法,包含下列步骤:利用一麦克风阵列接收多个音框的声音信号;计算各音框的声音信号于各频段对应该多个麦克风中的至少一双麦克风组合的两耳时间差;根据该计算结果统计各音框的声音信号的两耳时间差的直方图和累积直方图;根据该些累积直方图计算一第一两耳时间差门坎值;根据该些直方图和该第一两耳时间差门坎值计算一第二两耳时间差门坎值;以及根据该第一两耳时间差门坎值和该第二两耳时间差门坎值过滤该些音框的声音信号。其中,该第二两耳时间差门坎值大于该第一两耳时间差门坎值。
本发明还揭示语音增强系统,包含一麦克风阵列、一累积直方图模块、一第一两耳时间差门坎值计算模块、一第二两耳时间差门坎值计算模块以及一声音信号过滤模块。该两耳时间差计算模块用以计算各音框的声音信号于各频段对应该多个麦克风中的至少一双麦克风组合的两耳时间差。该累积直方图模块用以计算各音框两耳时间差的累积直方图。该第一两耳时间差门坎值计算模块用以计算基于累积直方图的第一两耳时间差门坎值。该第二两耳时间差门坎值计算模块用以计算基于直方图和该第一两耳时间差门坎值的第二两耳时间差门坎值。该声音信号过滤模块用以过滤基于第一两耳时间差门坎值和该第二两耳时间差门坎值的声音信号。
也以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1显示本发明的一实施例的语音增强系统的示意图;
图2显示本发明的一实施例的语音增强方法的流程图;
图3显示本发明的一实施例的声音信号的时域和频域图;
图4显示本发明的一实施例所计算的两耳时间差的累积直方图;
图5显示本发明的另一实施例所计算的两耳时间差的累积直方图;
图6显示本发明的另一实施例的语音增强方法的流程图;
图7显示本发明的一实施例所计算的两耳时间差的直方图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210008319.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:热锻造用轧制棒钢或线材
- 下一篇:方形无刷电机