首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于物理波和循环网络的语音情感识别方法有效

申请号：	202110418944.0	申请日：	2021-04-19
公开（公告）号：	CN113284515B	公开（公告）日：	2023-05-02
发明（设计）人：	王春立;郑纯军	申请（专利权）人：	大连海事大学
主分类号：	G10L25/63	分类号：	G10L25/63;G10L25/30;G10L25/03
代理公司：	大连东方专利代理有限责任公司 21212	代理人：	陈丽;李洪福
地址：	116026 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于物理循环网络语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于物理波和循环网络的语音情感识别方法，其特征在于，所述方法包括：

获取待识别的语音段；

对所述语音段进行扩展处理，得到延拓声波场；

从声波的传输机制入手，根据波动物理动力学与情感表达的映射关系确定对音频信号进行特征提取的物理波模型，基于所述物理波模型对所述延拓声波场进行特征提取；

利用训练好的循环网络模型对提取出的特征进行语音情感识别，得到所述语音段的语音情感；所述循环网络模型采用3层双向长短期记忆模型，每层长短期记忆模型的隐藏节点具有256个单元；在长短期记忆模型的第3层后，还包括注意力层；将注意力层的输出注入全连接层和Softmax，输出预测情感分类结果；

其中，所述物理波模型包括：

当波在空间中传播时，其携带的信息处理的内存和容量由波提供；

根据标量场分布的动力学，时间和空间的波函数u_t＝u(x,y,z,t)由波动方程控制，其中x，y，z表示空间点的坐标，t表示时间；

使用时间步长为Δt的中心有限差分进行时间离散，如下式所示：

其中，是拉普拉斯算子，c是波速的空间分布，f_t＝f(x,y,z,t),其中f是源项，f_t是源项的时间分布；

令h_t表示当前时刻的输出，得到

其中，b表示阻尼系数，z_o(t)表示输出门；

设置c_t用于表示当前时刻的单元状态，得到

上式将输入序列转化为具有时序关系的输出序列，之前的每一步操作都被编码成循环神经网络的隐藏状态，在每一步中都得到了更新，其更新形式与长短期记忆模型的形式一致：c_t＝z_f⊙c_t-1+z_i⊙z，其中，z_f和z_i分别表示长短期记忆模型中的忘记门和输入门，于是有：z＝f(t)；

得到：

其中，σ为sigmoid函数，x_t表示原始声学信号的输入；

基于上式求出w_f，w_i，w的值，w_f，w_i，w分别代表忘记门、输入门和输出的权重；

通过u_t的依赖关系，波动方程能够训练波速c的分布，其中，c＝c_lin+u_t²·c_nl；c_lin是波传输材料区域中具有的线性响应关系，c_nl是波传输材料区域中具有的非线性响应关系。

2.根据权利要求1所述的基于物理波和循环网络的语音情感识别方法，其特征在于，对所述语音段进行扩展处理，包括：

利用固定步长深度递推声波延拓方法对所述语音段进行扩展处理。

3.根据权利要求2所述的基于物理波和循环网络的语音情感识别方法，其特征在于，所述固定步长深度递推声波延拓方法包括：

确定延拓标准，所述延拓标准下生成的语音信号能够表达完整的情感；

识别所述语音段中固定步长下的最佳连续语音帧区间，所述最佳连续语音帧区间为所述语音段的所有区间中深度累计最大的区间；

采用固定步长平移和校正的方法将所述最佳连续语音帧区间拓展至所述语音段的全部区间，得到延拓声波场。

4.根据权利要求1所述的基于物理波和循环网络的语音情感识别方法，其特征在于，延拓标准为：

将所述语音段视为声波，假设当前声波点的坐标为(x,y),深度方向坐标为z，圆频率为w，则在深度z处的声波场表示为W(x,y,z,w)，在深度域声波延拓的方程为：其中，S是亥姆霍兹算子的单平方根算子，表示为：其中，v(x,y,z)是在空气介质下语音传播的波速。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连海事大学，未经大连海事大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110418944.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种压缩气体过滤安全预警装置
下一篇：一种从微弱信号中识别船舶轴系动态固有频率的方法

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top