[发明专利]基于度量学习的语音时序数据相似性度量方法在审
| 申请号: | 201910430437.1 | 申请日: | 2019-05-22 |
| 公开(公告)号: | CN110147843A | 公开(公告)日: | 2019-08-20 |
| 发明(设计)人: | 王念滨;刘鹏;张毅;王红滨;周连科;张海彬;崔琎 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 刘冰 |
| 地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 时序数据 相似性度量 语音 矩阵 时间弯曲 度量 马氏 损失函数 训练集样本 局部距离 框架建立 马氏距离 数据分类 系数计算 求解 可用 算法 学习 样本 | ||
1.基于度量学习的语音时序数据相似性度量方法,其特征在于,具体包括以下步骤:
步骤一、获取语音时序数据;
步骤二、结合马氏距离和斯皮尔曼线性相关性系数计算语音时序数据的局部距离,然后使用动态时间弯曲算法得到动态时间弯曲距离的表达式;
步骤三、根据PGDM度量学习框架建立以马氏矩阵为参数的损失函数;
步骤四、求解损失函数计算出针对当前训练集样本的马氏矩阵;
步骤五、将步骤四中求得的马氏矩阵代入动态时间弯曲距离的表达式,得到每两个语音时序数据样本的相似性度量。
2.根据权利要求1所述基于度量学习的语音时序数据相似性度量方法,其特征在于,步骤二中所述语音时序数据的局部距离具体为:
Dlocal(Xi,Yj)=DM(Xi,Yj)/1+ρ(Xi,Yj) (1)
其中,Dlocal(Xi,Yj)为局部距离;DM(Xi.Yj)为马氏距离,ρ(Xi,Yj)为斯皮尔曼线性相关性系数,Xi、Yj分别为两个时序数据分别在i、j两个时刻的向量。
3.根据权利要求1或2所述基于度量学习的语音时序数据相似性度量方法,其特征在于,步骤二中所述动态时间弯曲距离的表达式为:
其中,DTW(T1,T2)为动态时间弯曲距离;上标T表示转置,k=1,2,…,t;t表示表示动态时间弯曲(DTW规整)后的最优路径长度;时序数据T1={X1,X2,...,Xm1},时序数据T2={Y1,Y2,...,Ym2},Xi、Yj每个时刻记录的变量个数均n,M表示马氏矩阵。
4.根据权利要求3所述基于度量学习的语音时序数据相似性度量方法,其特征在于,步骤二中所述得到动态时间弯曲距离的表达式的具体过程包括:
步骤二一、根据局部距离计算动态时间弯曲的最优路径:
r(i,j)=Dlocal(Xi,Yj)+min{r(i-1,j-1),r(i-1,j),r(i,j-1)} (3)
其中,r(i,j)表示从动态时间弯曲的距离成本矩阵的起始点(1,1)到(i,j)的累积最小距离;
步骤二二、根据动态时间弯曲的最优路径,两个时序数据T1和T2能够扩展为长度为t的新的时序数据和表示为:
其中,为在k时刻的数据向量、为在k时刻的数据向量;分别为T1、T2的动态规划路径;
步骤二三、则多变量时间序列数据T1和T2的动态时间弯曲距离DTW(T1,T2)能够表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910430437.1/1.html,转载请声明来源钻瓜专利网。





