[发明专利]一种佩戴式设备语音信号处理装置及方法在审
| 申请号: | 202110616157.7 | 申请日: | 2021-06-02 |
| 公开(公告)号: | CN113345455A | 公开(公告)日: | 2021-09-03 |
| 发明(设计)人: | 王鸣;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
| 主分类号: | G10L21/02 | 分类号: | G10L21/02;G01C9/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 佩戴 设备 语音 信号 处理 装置 方法 | ||
本发明实施例公开了一种佩戴式设备语音信号处理装置及方法,所述装置包括:语音采集模块、倾斜角获取模块、波束方向判定模块和信号处理模块,所述语音采集模块采集原始语音信号,通过倾斜角获取模块获取语音采集设备的倾斜角度,所述波束方向判定模块根据倾斜角度判定波束成型的目标方向,所述信号处理模块对目标方向声音进行增强,非目标方向声音进行衰减。本发明解决了现有佩戴式语音设备倾斜状态下语音处理效果差的问题。
技术领域
本发明实施例涉及语音处理技术领域,具体涉及一种佩戴式设备语音信号处理装置及方法。
背景技术
目前对于多人说话人分离,业内通常的做法是使用硬件设备(如麦克风阵列、双向麦克风等)进行声音收集上的说话人分离,或者使用声音特征的聚类分类算法在单声道音频上进行说话人分离。说话人分离本身只是将人声音频按照不同发音人进行分类的操作,其中不涉及声音所属发音人的具体身份的识别,对声音所属发音人具体身份的识别属于声纹识别(说话人识别)技术解决的问题通过说话人分离从海量的语音中获取感兴趣的语音。在对语音进行说话人分离的过程中,需要将语音进行切分,再对切分的语音片段标注说话人信息。
基于声纹的方案难以解决说话人声音相近的问题,基于语义的方案对于开放式对话的场景性能不佳,而单纯使用信号处理的方式,对于设备在佩戴时产生倾斜的问题处理效果不佳。
发明内容
本发明实施例的目的在于提供一种佩戴式设备语音信号处理装置及方法,用以解决现有佩戴式语音设备倾斜状态下语音处理效果差的问题。
为实现上述目的,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种佩戴式设备语音信号处理装置,所述装置包括:语音采集模块、倾斜角获取模块、波束方向判定模块和信号处理模块,所述语音采集模块采集原始语音信号,通过倾斜角获取模块获取语音采集设备的倾斜角度,所述波束方向判定模块根据倾斜角度判定波束成型的目标方向,所述信号处理模块对目标方向声音进行增强,非目标方向声音进行衰减。
进一步地,所述语音采集模块通过安装在佩戴式设备上安装的麦克风面阵,采集原始输入语音。
进一步地,所述语音采集模块获取原始语音后,将语音信号转换为电信号,并对电信号进行预处理,预处理操作包括:滤波、除杂。
进一步地,所述倾斜角获取模块通过安装在佩戴式设备上的加速度传感器获取当前设备的倾斜角度,并将倾斜角度发送至波束方向判定模块。
进一步地,所述波束方向判定模块根据倾斜角度判定波束成形的目标方向,通过倾斜角度可以为波束成形算法提供准确的目标角度信息。
进一步地,所述信号处理模块将利用波束成形算法对目标方向人声进行增强,对非目标方向声音进行衰减,获取目标方向说话人的声音。
第二方面,本发明实施例还提供一种佩戴式设备语音信号处理方法,所述方法为:
通过佩戴式设备上安装的麦克风面阵获取原始语音;
利用佩戴式设备上的加速度传感器获取当前设备的倾斜角度;
根据倾斜角度判断波束成形方向;
利用波束成形算法对目标方向声音进行增强,非目标方向声音进行衰减。
进一步地,所述原始语音在获取后,将语音信号转变为电信号,并对电信号进行滤波、除杂。
进一步地,所述波束成形算法对目标方向的声音进行增强后,获取目标方向说话人的语音,对语音进行分离降噪,进行语音分离识别。
本发明实施例提供的技术方案至少具有如下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110616157.7/2.html,转载请声明来源钻瓜专利网。





