[发明专利]一种语音信号降噪方法及装置在审
申请号: | 202010099456.3 | 申请日: | 2020-02-18 |
公开(公告)号: | CN111402912A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 李鹏;马金龙 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0272;G10L21/028;G06K9/00 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信号 方法 装置 | ||
本发明公开了一种语音信号降噪方法及装置,包括:获取实时图像;分析实时图像,从预设图像确定出多个声源方向;对声源方向进行标注以区分人声方向信息和噪声方向信息;根据所述人声方向信息和噪声方向信息对所述实时图像内的声音数据进行降噪;输出降噪后的声音数据。通过利用实时图像中人声方向信息和噪声方向信息对实时图像内的声音数据进行降噪,使得处理的过程中提供多个方向的声音数据来进行降噪,并且利用了实时图像中的人声方向和噪声方向来对声音数据进行降噪,通过人声和噪声的方向可以将声音数据中的人声和噪声分离开来,使得最终的去噪效果更加明显和高效。
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种语音信号降噪方法及装置。
背景技术
目前,随着科技的进步和发展,人们的生活质量越来越高,在享受物质生活的基础上去追求更高的精神生活,在他们的闲暇时间去KTV和酒吧等娱乐设施去放松身心,但由于上述环境中的声音都比较嘈杂,在人们说话的过程中会有大量的噪音乱入,对于人们之间的交流有很大的影响,于是针对这项问题研究出了降噪方法,现有的降噪方法为通过确定发音人的方位,采集发音人的发音信息,基于此信息指导波束形成做固定方向的语音增强,进而实现降噪。上述技术方法存在以下缺点,单纯的对人声语音进行增强,实际的原理是通过提高人声语音来降低噪音的干扰,从本质上没有去处噪音使得固定波束形成方法无法获得令人满意的噪声抑制效果,并且上述方法在低信噪比的环境下语音的增强效果不强,影响了用户的使用体验。
发明内容
针对上述所显示出来的问题,本方法基于从实时图像中确定人声和噪声方向信息进而根据人声和噪声方向信息对声音数据进行降噪,最后输出降噪后的声音数据,获得纯净的人声。
一种语音信号降噪方法,包括以下步骤:
获取实时图像;
分析所述实时图像,从所述实时图像确定出多个声源方向;
对所述声源方向进行标注以区分人声方向信息和噪声方向信息;
根据所述人声方向信息和噪声方向信息对所述实时图像内的声音数据进行降噪;
输出降噪后的声音数据。
优选的,所述获取实时图像,包括:
在实时环境中心设置一个能够360°旋转的摄像头;
启动所述摄像头,利用所述摄像头获取所述实时环境内整体的图像;
确定所述整体的图像为所述实时图像。
优选的,所述分析所述实时图像,从所述实时图像确定出多个声源方向,包括:
利用目标检测算法识别出所述实时图像内的能够发音的物体,所述能够发音的物体包括用户在内;
记录所述能够发音的物体中每个物体的具体位置;
基于所述具体位置,利用波向传达算法确定出所述各物体的声源方向。
优选的,所述根据所述人声方向信息和噪声方向信息对所述实时图像内的声音数据进行降噪,包括:
利用固定方向波束形成算法对所述声音数据作增强处理;
将增强处理后的所述声音数据中的人声数据确认为当前带噪信号;
将增强处理后的所述声音数据中的噪声数据确认为噪声参考信号;
将所述当前带噪信号和所述噪声参考信号输入到波束形成器中作自适应降噪处理。
优选的,所述输出降噪后的声音数据,包括:;
利用所述波束形成器将所述当前带噪语音中的当前人声成分和当前噪声成分分离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010099456.3/2.html,转载请声明来源钻瓜专利网。