[发明专利]基于联合分布最小二乘回归的跨数据库语音情感识别方法及装置有效
| 申请号: | 202010372728.2 | 申请日: | 2020-05-06 |
| 公开(公告)号: | CN111583966B | 公开(公告)日: | 2022-06-28 |
| 发明(设计)人: | 宗源;江林;张佳成;郑文明;江星洵;刘佳腾 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/27;G10L25/24;G10L25/21;G10L25/18 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 冯艳芬 |
| 地址: | 211102 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 联合 分布 最小 回归 数据库 语音 情感 识别 方法 装置 | ||
1.一种基于联合分布最小二乘回归的跨数据库语音情感识别方法,其特征在于该方法包括:
(1)获取两个语音数据库,分别作为训练数据库和测试数据库,其中,训练数据库中包含有若干语音片段和对应的语音情感类别标签,测试数据库中仅包含有若干待识别语音片段;
(2)利用若干声学低维描述子对语音片段进行处理并进行统计,将统计得到的每个信息作为一个情感特征,并将多个情感特征组成向量作为对应语音片段的特征向量;
(3)建立基于联合分布的最小二乘回归模型,利用已知标签的训练数据库与未知标签的测试数据库对其联合训练,得到一个连接语音片段与语音情感类别标签之间的稀疏投影矩阵;其中,建立的最小二乘回归模型为:
式中,表示找到使括号内式子最小的稀疏投影矩阵P,Ls∈Rc×n为训练数据库语音片段的语音情感类别标签向量,C为语音情感类别的类数,n为训练数据库语音片段的个数,Xs为训练数据库语音片段的特征向量,Xs∈Rd×n,d为特征向量的维数,P为稀疏投影矩阵,P∈Rd×c,PT为P的转秩矩阵,为Frobenius范数的平方,λ、μ为控制正则项的权衡系数,Xt∈Rd×m为测试数据库语音片段的特征向量,m为测试数据库语音片段的段数,分别为训练数据库、测试数据库中情感类别属于第c类的语音片段的集合,c表示情感类别的序号,nc、mc分别为测试数据库中情感类别属于第c类的语音片段的个数,|| ||2,1为2,1范数;
所述利用已知标签的训练数据库与未知标签的测试数据库对其进行联合训练的方法具体包括:
(3-1)将所述最小二乘回归模型转换为:
s.t.P=Q
(3-2)通过上述转换后的最小二乘回归模型,估算测试数据库中所有语音片段对应的语音情感类别伪标签形成的伪标签矩阵
(3-3)根据伪标签矩阵统计得到和mc,进而计算得到
(3-4)基于对转换后的最小二乘回归模型利用增广拉格朗日乘子法进行求解,得到投影矩阵估计值
(3-5)根据投影矩阵估计值采用下式对伪标签矩阵进行更新:
式中,表示中间辅助变量,为第i列第j行的元素,表示求取第i列元素值最大的一行的行数j,是伪标签矩阵第i列第k行的元素;
(3-6)采用更新后的伪标签矩阵返回执行步骤(3-3),直至达到预设的循环次数后,将循环结束后得到的投影矩阵估计值作为学习得到的稀疏投影矩阵P;
(4)对于测试数据库中待识别语音片段,按照步骤(2)得到特征向量,并采用步骤(3)中学习到的稀疏投影矩阵,得到对应的语音情感类别标签。
2.根据权利要求1所述的基于联合分布最小二乘回归的跨数据库语音情感识别方法,其特征在于:步骤(2)具体包括:
(2-1)对于每个语音片段,计算其16个声学低维描述子的值和对应的增量参数;所述16个声学低维描述子分别为:时间信号过零率、帧能量均方根、基音频率、谐波信噪比以及梅尔顿频率倒谱系数1-12;
(2-2)对于每个语音片段,分别对其16个声学低维描述子进行12种统计函数处理,所述12种统计函数分别为求平均值、标准差、峰态、偏度、最大值、最小值、相对位置、相对范围,以及两个线性回归系数及其均方误差;
(2-3)将统计得到的每个信息作为一个情感特征,并将多个情感特征组成向量作为对应语音片段的特征向量。
3.根据权利要求1所述的基于联合分布最小二乘回归的跨数据库语音情感识别方法,其特征在于:步骤(3-2)具体包括:
(3-2-1)利用转换后的最小二乘回归模型不加正则项的公式,求得投影矩阵估计值的初始值
(3-2-2)根据投影矩阵估计值的初始值采用下式得到伪标签矩阵的初始值:
式中,表示中间辅助变量,是伪标签矩阵的初始值第i列第k行的元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010372728.2/1.html,转载请声明来源钻瓜专利网。





