[发明专利]多发声者发声运动特征波形的获取方法及装置、电子设备有效
申请号: | 202110534901.9 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113257271B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 林峰;王超;许文曜;任奎 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 应孔月 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多发 发声 运动 特征 波形 获取 方法 装置 电子设备 | ||
本申请公开了一种多发声者发声运动特征波形的获取方法及装置、电子设备,该方法包括:采集空间中的回波信号,其中所述回波信号由频率调制后的连续波感知空间中多个发声者喉咙振动所返回的信号,所述频率调制后的周期性连续波由调频连续波雷达发射;对所述回波信号的每一个周期的波形进行傅里叶变换,得到频谱图集S1;从所述频谱图集S1中定位各个发声者所在频点;根据所述各个发声者所在频点提取各个发声者喉咙振动的特征波形。
技术领域
本申请涉及多发声者信号分离技术领域,尤其涉及一种多发声者发声运动特征波形的获取方法及装置、电子设备。
背景技术
随着物联网的快速发展,带有语音交互功能的智能终端正广泛部署到各行各业以及人们的日常生活中,例如越来越多的智能家居采用语音助手作为人机交互的主要方式。
目前针对多个发声者的发声者信号感知多采用单个麦克风或麦克风阵列的方式,并结合盲源分离或波束成形等技术来实现对各个发声者信号的获取,但是目前的基于声学感知的解决方案受声学噪声的影响大,且基于麦克风阵列的方法需要额外的硬件成本。
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:
对于基于声学的多发声者场景下各个发声者信号的获取,音频采集设备所处环境中的噪音会影响各个发声者信号的获取效果,降低信噪比,而基于麦克风阵列的解决方案会增加硬件成本和开销。
发明内容
本申请实施例的目的是提供一种多发声者发声运动特征波形的获取方法及装置、电子设备,以解决相关技术中存在的受环境噪音影响大、需要额外硬件开销的技术问题。
根据本申请实施例的第一方面,提供一种多发声者发声运动特征波形的获取方法,包括:采集空间中的回波信号,其中所述回波信号由频率调制后的连续波感知空间中多个发声者喉咙振动所返回的信号,所述频率调制后的周期性连续波由调频连续波雷达发射;对所述回波信号的每一个周期的波形进行傅里叶变换,得到频谱图集S1;从所述频谱图集S1中定位各个发声者所在频点;根据所述各个发声者所在频点提取各个发声者喉咙振动的特征波形。
进一步地,对所述回波信号的每一个周期的波形进行傅里叶变换,得到频谱图集,包括:
对所述回波信号的每一个周期的波形进行傅里叶变换,得到每个周期的频谱图;
将各个周期的频谱图组成频谱图集S1。
进一步地,将各个周期的频谱图组成频谱图集S1前还包括:
将所述频谱图按相应所述回波信号的返回时间顺序从先到后依次排列。
进一步地,从所述频谱图集中定位各个发声者所在频点,包括:
按所述频谱图的先后顺序,用后一张频谱图的各个频点的幅值减去前一张频谱图中相应频点的幅值后取绝对值,得到新的频谱图集S2,记S2中每张频谱图所包含的频点数为m;
每次选取频谱图中的一个频点,计算S2中所有频谱图中该频点幅值的方差σ,直到m个频点幅值的方差计算完毕;
计算所得所有频点幅值方差的均值μ,m个频点中幅值方差σ大于μ的频点即为发声者所在频点。
进一步地,根据所述各个发声者所在频点提取各个发声者喉咙振动的特征波形,包括:
从S1中提取S2中所述σ大于μ的各个频点的幅值,所述幅值的提取按照频谱图排列的先后顺序,N个频点共得到N条幅值变化曲线;
对所述N条幅值变化曲线进行高通滤波;
对滤波后的N条曲线分别进行小波分解或经验模态分解,提取包含所述各个发声者喉咙振动信息的特征波形。
根据本发明实施例的第二方面,提供一种多发声者发声运动特征波形的获取装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110534901.9/2.html,转载请声明来源钻瓜专利网。