[发明专利]一种时域柔性振动传感器语音增强方法及系统在审

专利信息
申请号: 202111313917.3 申请日: 2021-11-08
公开(公告)号: CN114067818A 公开(公告)日: 2022-02-18
发明(设计)人: 郑昌艳;杨吉斌;徐利国;崔洪亮;刘宁;葛含;黄显 申请(专利权)人: 中国人民解放军火箭军士官学校
主分类号: G10L21/02 分类号: G10L21/02;G10L21/0232;G10L21/0264;G10L21/057;G10L21/0224
代理公司: 南京理工大学专利中心 32203 代理人: 朱炳斐
地址: 262500 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 时域 柔性 振动 传感器 语音 增强 方法 系统
【权利要求书】:

1.一种时域柔性振动传感器语音增强方法,其特征在于,所述算法包括以下步骤:

步骤1,对柔性振动传感器时域语音进行语音分割;

步骤2,对语音帧进行压缩并投射到隐性特征空间;

步骤3,基于双路径Transformer实现帧内以及帧间的特征注意力学习,建立隐性表达的局部和全局相关性;

步骤4,基于步骤3的结果,分别预测均衡成分和生成成分;

步骤5,基于步骤2和步骤4的结果,从隐性特征空间重构时域语音波形;

步骤6,进行重叠加获得最终增强的时域语音波形。

2.根据权利要求1所述的时域柔性振动传感器语音增强方法,其特征在于,步骤1所述对柔性振动传感器语音进行语音分割,具体包括:

步骤1-1,针对长为L的柔性传感器时域语音x(t)∈RL,按照帧长F、帧移H进行分帧,得到N个语音帧;其中N的计算公式为:

N=floor[(L-F)/H]+1

步骤1-2,针对一个训练批次的B条语音,按照步骤1-1的方式进行分帧,并采用补0方式,将所有语音的帧数补全为该批次中最大的语音帧数Nmax,并记录各条语音实际拥有的语音帧数量;

步骤1-3,将所有语音帧拼接后并进行汉明窗处理,得到三维的数据张量

3.根据权利要求1或2所述的时域柔性振动传感器语音增强方法,其特征在于,步骤2所述对语音帧进行压缩并投射到隐性特征空间,具体包括:

步骤2-1,通过一个2维卷积对语音帧进行压缩;其中,所述2维卷积的卷积核的尺寸为(1,3)、步长为(1,2),卷积的特征通道数为C;

步骤2-2,压缩后的语音帧依次经层归一化处理、PReLU激活函数后,送入2维1×1卷积和PReLU激活函数,由此将语音数据转换到新的特征空间;其中,所述2维1×1卷积的特征通道数为C。

4.根据权利要求3所述的时域柔性振动传感器语音增强方法,其特征在于,步骤3所述基于双路径Transformer实现帧内以及帧间的特征注意力学习,建立隐性表达的局部和全局相关性,具体通过M个堆叠的双路径Transformer块实现,双路径Transformer块的输入为张量Dpre∈[B,C,Nmax,F'],包括帧内Transformer和帧间Transformer;具体过程包括:

步骤3-1,帧内Transformer将注意力作用于维度F',即作用于同一语音帧内的样点,则经过帧内Transformer的作用输出为Dintra

Dintra=transformer(Dpre[:,:,:,i]),i=1,...,F'

式中,transformer(·)表示Transformer变换,特征图通道数设置为C,则Dintra∈[B,C,Nmax,F'];

帧间Transformer将注意力作用在维度Nmax,即作用于语音序列帧间的样点,特征图通道数仍然设置为C,则经过帧间Transformer的作用输出为Dinter

Dinter=transformer(Dintra[:,:,i,:]),i=1,...,Nmax

其中,Dinter∈[B,C,Nmax,F'];

步骤3-2,对帧内Transformer和帧间Transformer的输出均进行群归一化;

步骤3-3,分别对帧内Transformer的输入和对应的群归一化的输出、帧间Transformer的输入和对应的群归一化的输出建立残差连接,其中帧内Transformer的输入为步骤2的结果,帧间Transformer的输入为帧内Transformer经群归一化后的输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军火箭军士官学校,未经中国人民解放军火箭军士官学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111313917.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top