[发明专利]话音增强方法及其装置在审

申请号：	201480044082.8	申请日：	2014-05-30
公开（公告）号：	CN105453174A	公开（公告）日：	2016-03-30
发明（设计）人：	赵在衍;崔玮玮;李承烈	申请（专利权）人：	三星电子株式会社
主分类号：	G10L21/0208	分类号：	G10L21/0208
代理公司：	北京市柳沈律师事务所 11105	代理人：	钱大勇;张泓
地址：	韩国***	国省代码：	韩国;KR
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	话音增强方法及其装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

一个或多个示范性实施例涉及一种使用单一或多个麦克风的话音增强的方法和装置，并且更具体地，涉及一种应用话音检测技术和说话者方向检测技术的话音增强的方法和装置。

背景技术

话音识别技术是将由用户等输入的话音信号识别为与预定语言对应的信号的技术。例如，话音识别技术可以用在控制诸如话音识别导航设备、移动电话或TV的预定电子设备的操作中。

通过去除混合在输入的话音信号中的噪声来提取纯话音信号的话音增强技术可以用于改善话音识别的识别率。话音增强相关技术的例子是集中预定方向上的话音并且去除周围的噪声的波束形成以及去除平稳噪声的噪声抑制。

发明内容

技术问题

本发明提供了在话音增强中使用说话者的发言部分和位置信息来去除噪声的方法。本发明提供了基于方向信息的话音增强方法，其中使用基于话音方向信息的方向的估计以及话音增强控制技术。

技术方案

根据本发明的一方面，提供了一种话音增强装置，其包括：传感器单元，包括至少一个麦克风；话音检测单元，用于通过使用传感器单元的信号来检测说话者的话音；方向估计单元，用于通过使用传感器单元的信号来估计说话者的方向，并且生成指示所估计的方向的方向信息；以及话音增强单元，用于增强输入到所述至少一个麦克风的说话者的话音，其中话音检测单元基于通过使用话音检测单元检测话音的结果来控制方向估计单元和话音增强单元的操作，并且方向估计单元向话音增强单元发送方向信息。

有益效果

本发明构思涉及一种当用户说话时找到用户的方向的话音增强技术。话音增强技术在话音部分和非话音部分不同地工作，从而是高效的，并且确保高性能。本发明构思不但可以应用于移动电话，而且应用于TV、平板或助听器。特别是，诸如手表、指环或眼镜的人体附着计算设备(可穿戴计算机或可穿戴设备)最近已经逐渐得到关注，并且被生产为产品。如果本发明构思与这些可穿戴计算机或可穿戴设备结合，则可以提供高效的低功率算法。

附图说明

图1是根据实施例的话音增强装置10的示意性框图；

图2是根据另一实施例的话音增强装置20的示意性框图；

图3是根据实施例的话音增强方法的流程图；

图4是根据另一实施例的话音增强方法的流程图；

图5示出根据实施例的用于移动电话的话音增强装置10；

图6示出根据实施例的用于TV的话音增强装置10；

图7示出根据实施例的用于平板的话音增强装置10；

图8示出根据另一实施例的用于可穿戴设备的话音增强装置10；以及

图9示出根据实施例的用于耳机或助听器的话音增强装置10。

最佳模式

根据本发明的一方面，提供了一种话音增强装置，其包括：传感器单元，包括至少一个麦克风；话音检测单元，用于通过使用传感器单元的信号来检测说话者的话音；方向估计单元，用于通过使用传感器单元的信号来估计说话者的方向，并且生成指示所估计的方向的方向信息；以及话音增强单元，用于增强输入到所述至少一个麦克风的说话者的话音，其中方向估计单元基于估计方向的结果来控制话音检测单元的操作，并且向话音增强单元发送方向信息；并且话音检测单元基于检测话音的结果来控制话音增强单元的操作。

传感器单元可以包括麦克风、相机和骨传导传感器中的至少一个，其中话音检测单元通过使用所述至少一个麦克风的信号来检测是否存在话音成分，通过使用相机的信号来检测说话者的嘴唇的运动，通过使用骨传导传感器的信号来检测说话者是否已经说话，或者通过组合至少一个麦克风、相机和骨传导传感器中的至少两个来检测话音。

传感器单元可以包括从至少两个麦克风和相机中选择的至少一个，并且其中方向估计单元通过使用至少两个麦克风的信号之间的差或者通过使用相机的信号来识别说话者的脸部或者检测说话者的嘴唇的运动，来估计方向。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三星电子株式会社，未经三星电子株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201480044082.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种低辐射玻璃
下一篇：污泥与玉米秸秆混合发酵改善中温厌氧消化效果的工艺

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]话音增强方法及其装置在审

专利文献下载