[发明专利]基于度量学习的语音时序数据相似性度量方法在审
| 申请号: | 201910430437.1 | 申请日: | 2019-05-22 |
| 公开(公告)号: | CN110147843A | 公开(公告)日: | 2019-08-20 |
| 发明(设计)人: | 王念滨;刘鹏;张毅;王红滨;周连科;张海彬;崔琎 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 刘冰 |
| 地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 时序数据 相似性度量 语音 矩阵 时间弯曲 度量 马氏 损失函数 训练集样本 局部距离 框架建立 马氏距离 数据分类 系数计算 求解 可用 算法 学习 样本 | ||
本发明提供基于度量学习的语音时序数据相似性度量方法,属于数据分类技术领域。本发明首先获取语音时序数据;结合马氏距离和斯皮尔曼线性相关性系数计算语音时序数据的局部距离,然后使用动态时间弯曲算法得到动态时间弯曲距离的表达式;再根据PGDM度量学习框架建立以马氏矩阵为参数的损失函数;求解损失函数计算出针对当前训练集样本的马氏矩阵;最后将步骤四中求得的马氏矩阵代入动态时间弯曲距离的表达式,得到每两个语音时序数据样本的相似性度量。本发明解决了现有语音时序数据相似性度量不准确的问题。本发明可用于语音时序数据的相似性度量。
技术领域
本发明涉及语音时序数据相似性度量方法,属于数据分类技术领域。
背景技术
多变量时序数据数据分析是语音识别领域研究非常重要的工作。目前大部分主流的时序数据分析方法一般都只适用于单变量时序数据的数据分析,在多变量时序数据分析领域目前的研究不够完善(林珠,邢延.数据挖掘中适用于分类的时序数据特征提取方法[J].计算机系统应用,2012,21(10):224-229.)。相比于单变量时序方法,多变量时序数据分析方法适用领域更加多样,应用范围也更加广泛。目前常用的多变量时序数据相似性度量方法大多都是基于传统方法改进而来。例如:基于欧氏距离的动态时间弯曲(Mahalanobis Distance-Based Dynamic Time Wraping,ED-DTW)方法、基于马氏距离的动态时间弯曲(Mahalanobis Distance-Based Dynamic Time Wraping,MD-DTW)方法(Mei J,Liu M,Wang Y F,et al.Learning a Mahalanobis Distance-Based Dynamic TimeWarping Measure for Multivariate Time Series Classification[J].IEEETransactions on Cybernetics,2016,46(6):1363-1374.)。另外,Abdullah Mueen在2017年针对在稀疏时间序列数据上使用动态时间弯曲方法效率非常低的特点,提出了AWarp度量方法(Mueen A,Chavoshi N,Abuelrub N,et al.Fast Warping Distance for SparseTime Series[C]//IEEE International Conference on Data Mining.IEEE,2017.)。Boghrati Reihance提出了会话水平的语法相似性度量(Conversation level SyntaxSimilarity Metric,CSSM)(Boghrati R,Hoover J,Johnson K M,et al.Conversationlevel syntax similarity metric[J].Behavior Research Methods,2017.)。马氏距离是经常使用的时序数据相似性度量方法,但是单独使用的话只能应用于维度相同的时序数据。但是语音时序数据的长度并不相同,而且由于外部因素影响,语音时序数据可能在时间轴上产生偏移和伸缩。动态时间弯曲(Dynamic Time Wraping,DTW)是目前可以比较好的解决时序数据的偏移和伸缩的方法,而且该方法动态时间弯曲也适用于长度不同的时序数据。基于马氏距离的动态时间弯曲算法(MD-DTW)是目前非常流行的,该方法使用马氏距离来计算时序数据的局部距离,再使用动态时间弯曲来计算时序数据的全局距离;虽然MD-DTW方法引入马氏距离后使得动态时间弯曲在计算局部距离的过程得到了优化,但是在计算局部距离时,马氏距离仅仅考虑的是数据内部变量与变量的关系,对于两个变量整体的相关性缺乏考虑,导致相似性度量结果不够准确,进而影响分析结果。度量学习(metriclearning)可以根据指定的分类或聚类任务,从训练集样本空间学习出一个优秀的距离度量参数,从而更加准确快速的表示测试机样本的相似性度量。常见的度量学习方法有基于概率的全局度量学习方法(Probabilistic global Distance metric learning,PGDM)(Xing E P,Ng A Y,Jordan M I,et al.Distance Metric Learning with Applicationto Clustering with Side-Information.[C]//International Conference on NeuralInformation Processing Systems.MIT Press,2002.)、信息理论在线度量学习方法(Information Theoretic Metric Learning,ITML)(Davis J V,Kulis B,Jain P,etal.Information-theoretic metric learning[C]//Icml 07:International Conferenceon Machine Learning.2007.)、基于大间隔理论的度量学习方法(Large Margin NearestNeighbor,LMNN)(Weinberger K Q,Saul L K.Distance Metric Learning for LargeMargin Nearest Neighbor Classification[M].JMLR.org,2009.10(1):207-244.)等;但是传统度量学习算法一般都只能直接应用于单变量时序数据的数据分析任务,因此也不能直接运用于语音时序数据的相似性度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910430437.1/2.html,转载请声明来源钻瓜专利网。





