[发明专利]一种基于长短期记忆网络的语音端点检测方法及系统有效

专利信息
申请号: 202110217938.9 申请日: 2021-02-26
公开(公告)号: CN112967739B 公开(公告)日: 2022-09-06
发明(设计)人: 张鹏;李姝;李晔;冯涛;汪付强 申请(专利权)人: 山东省计算中心(国家超级计算济南中心)
主分类号: G10L25/87 分类号: G10L25/87;G10L25/30;G06N3/04;G06N3/08;G06K9/62
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李圣梅
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 短期 记忆 网络 语音 端点 检测 方法 系统
【权利要求书】:

1.一种基于长短期记忆网络的语音端点检测方法,其特征是,包括:

从语音数据中针对每一语音帧提取多分辨率耳蜗图特征,在一定范围内选取其数个上下文帧,将这些上下文帧按照时间顺序生成输入数据;

将输入数据输入到训练后的注意力增强型长短期记忆网络中,生成局部增强的上下文帧语境信息;

将局部增强后的数据输入到多头注意力层,生成全面增加权重的上下文帧信息;

将全面增加权重的数据输入到神经网络(分类器)中,进行语音端点检测并生成预测结果;

其中,注意力增强型长短期记忆网络在训练时,具体包括:

针对训练数据进行预处理,之后选取上下文帧;

初始化编码器,得到初始化的注意力增强型长短期记忆网络;

将训练数据输入注意力增强型长短期记忆网络中,得到局部增强的上下文帧信息;

对解码器进行初始化:初始化解码器的多头注意力模块,注意力头的数量与编码器的多头注意力模块相同;

确定解码器多头注意力层的参数;

将解码器多头注意力层的参数输入到多头注意力层,生成全面增加权重的上下文帧信息;

对全面增加权重的上下文帧信息进行批量标准化操作;

改变全面增加权重的上下文帧信息维度,将全面增加权重的数据输入到解码器的神经网络(分类器)中,生成最后的预测结果;

选取上下文帧时,标签也同步选取对应上下文帧标签,目标标签与解码器的预测输出维度一致;

利用解码器的预测输出概率与目标标签对编码器和解码器进行权值优化;

利用解码器的预测输出概率与目标标签对编码器和解码器进行权值优化的步骤包括:

损失函数使用交叉熵误差,计算模型一个batch数据的loss;

确定模型优化器;

优化器根据模型loss值更新编码器中多头注意力模块的全连接层权值、长短期记忆网络权值、dropout层权值;

优化器根据模型loss值更新解码器中多头注意力模块的全连接层权值、三层神经网络权值、批量标准化的数据均值E(x)与数据方差Var(x)。

2.如权利要求1所述的一种基于长短期记忆网络的语音端点检测方法,其特征是,从语音数据中针对每一帧提取多分辨率耳蜗图特征时,通过提取具有小帧长度和小平滑窗口的耳蜗图特征来产生局部信息,通过提取具有大帧长度和大平滑窗口的耳蜗图特征来产生全局信息。

3.如权利要求1所述的一种基于长短期记忆网络的语音端点检测方法,其特征是,为每一个输入帧选取上下文帧,具体为:

设置一个(w,u)参数,w限制选取范围,u是步长,每一帧及其左右相邻两帧固定,其余部分按照步长选取,计算得到每个数据包含的相邻帧的个数。

4.如权利要求1所述的一种基于长短期记忆网络的语音端点检测方法,其特征是,所述注意力增强型长短期记忆网络即编码器,包括:

增强注意力的长短期记忆单元,该单元按照时刻紧密连接,时刻与单元的个数是每一帧上下文帧的个数;

所述增强注意力的长短期记忆单元包括单元输入模块、多头注意力模块及长短期记忆模块;

所述输入模块用于在某一时刻产生自注意力结构的组合输入,并根据实际情况选择使用k个历史时刻单元状态;

所述多头注意力模块将组合输入经过全连接层线性变换生成Q表示,将k个历史状态经过全连接层线性变换生成K、V表示,利用Q、K、V表示生成上下文帧与历史时刻帧的关联信息;将关联信息经过全连接层线性变换,生成全新的单元输入;

所述长短期记忆模块接收所述多头注意力模块的输出,生成t时刻上下文帧之间的语境信息。

5.如权利要求1所述的一种基于长短期记忆网络的语音端点检测方法,其特征是,将局部增强后的数据输入到解码器多头注意力层,多头注意力层计算每一个上下文帧与其所有上下文帧之间的关联度分值;

所述解码器多头注意力层还包括位置信息,所述位置信息代表每一帧出现的时序顺序,相当于为每一帧编码,以便解码器能够准确识别所处理的帧的前后顺序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110217938.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top