[发明专利]一种人声屏蔽方法和电子设备有效
申请号: | 202210097399.4 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114120950B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 杨昭 | 申请(专利权)人: | 荣耀终端有限公司 |
主分类号: | G10K11/175 | 分类号: | G10K11/175;G10K11/178;G10L17/02;G10L17/06;G10L19/02;G10L21/02;G06K9/62 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 汪源 |
地址: | 518040 广东省深圳市福田区香蜜湖街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人声 屏蔽 方法 电子设备 | ||
本发明实施例提供的一种人声屏蔽方法和电子设备的技术方案中,根据采集的多个声音数据,确定当前场景中讲话人与声音数据的对应关系;响应于用户的操作,从当前场景中讲话人中确定目标人和目标人相对用户的初始相对方位信息;从目标人对应的声音数据中提取出目标声谱信息,同时根据初始相对方位信息得到空间差异补偿滤波系数;根据目标声谱信息、空间差异补偿滤波系数屏蔽目标人的声音。本发明实施例能够只屏蔽特定人员的声音,而保留其他人员声音和环境音。
技术领域
本发明涉及计算机技术领域,尤其涉及一种人声屏蔽方法和电子设备。
背景技术
目前TWS耳机以及AR/VR相关音频技术蓬勃发展,当用户身处一个多人、多声源的环境场景中时,有时会有只想屏蔽特定人员的声音,而保留其他人员声音和环境音的需求,而传统屏蔽声音信号的技术存在一刀切的问题,无法实现只屏蔽特定人员的声音,而保留其他人员声音和环境音。
发明内容
有鉴于此,本发明实施例提供了一种人声屏蔽方法和电子设备,能够只屏蔽特定人员的声音,而保留其他人员声音和环境音。
第一方面,本发明实施例提供了一种人声屏蔽方法,所述方法包括:
根据采集的多个声音数据,确定当前场景中讲话人与所述声音数据的对应关系;
响应于用户的操作,从所述当前场景中讲话人中确定目标人和所述目标人相对所述用户的初始相对方位信息;
从所述目标人对应的所述声音数据中提取出目标声谱信息,同时根据所述初始相对方位信息得到空间差异补偿滤波系数;
根据所述目标声谱信息、所述空间差异补偿滤波系数屏蔽所述目标人的声音。
结合第一方面,在第一方面的某些实现方式中,所述从所述目标人对应的所述声音数据中提取出目标声谱信息,包括:
通过对所述目标人对应的所述声音数据进行离散时间傅立叶变换得到离散傅立叶系数;
通过对所述离散傅立叶系数进行语音信号增强处理得到所述目标声谱信息。
结合第一方面,在第一方面的某些实现方式中,所述根据所述初始相对方位信息得到空间差异补偿滤波系数,包括:
获取所述目标人相对所述用户的实时相对方位信息;
根据所述初始相对方位信息和所述实时相对方位信息得到所述目标人相对所述用户的实时方位差异;
从空间线索库中获取与所述实时方位差异对应的所述空间差异补偿滤波系数。
结合第一方面,在第一方面的某些实现方式中,所述根据所述目标声谱信息、所述空间差异补偿滤波系数屏蔽所述目标人的声音,包括:
根据所述目标声谱信息和所述空间差异补偿滤波系数得到待屏蔽信号;
根据所述待屏蔽信号生成与所述待屏蔽信号反相位且幅度相等的屏蔽信号;
通过所述屏蔽信号屏蔽所述待屏蔽信号,以消除所述目标人的声音。
结合第一方面,在第一方面的某些实现方式中,所述根据采集的多个声音数据,确定当前场景中讲话人与所述声音数据的对应关系,包括:
根据所述多个声音数据,通过说话人分割聚类算法确定当前场景中讲话人与所述声音数据的对应关系。
结合第一方面,在第一方面的某些实现方式中,所述响应于用户的操作,从所述当前场景中讲话人中确定目标人和所述目标人相对所述用户的初始相对方位信息之前,还包括:
从所述声音数据中提取出对应的所述讲话人的声纹特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣耀终端有限公司,未经荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210097399.4/2.html,转载请声明来源钻瓜专利网。