[发明专利]一种时序数据相似度度量方法及度量系统在审
申请号: | 201910067744.8 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109948646A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 钱步月;张先礼;陆亮;王谞动;刘小彤;李扬;卫荣;郑庆华 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F17/27;G16H50/70 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似度度量 时序数据 度量系统 事件向量 卷积神经网络 时间映射 时序序列 事件发生 事件序列 数据表示 向量表示 向量加法 等维 鲁棒 向量 嵌入 送入 学习 监督 | ||
本发明公开了一种时序数据相似度度量方法及度量系统,包括以下步骤:首先,对于所有时序数据中的事件,学习各个事件的向量表示;其次,将各个事件发生的时间映射成与事件向量等维的向量,通过向量加法嵌入到事件向量中;最后,将最终的事件序列表示送入卷积神经网络进行有监督的学习,最终学得一个鲁棒的时序数据相似度度量模型;通过得到的相似度度量模型进行相似度度量。本发明对时序序列数据表示更加合理有效,从而可提升时序数据相似度度量的准确性。
技术领域
本发明属于时序数据相似度技术领域,特别涉及一种时序数据相似度度量方法及度量系统。
背景技术
数据相似度度量是数据科学中的基础问题,它涉及自然语言处理、数据检索、队列分析等多个应用领域。现实场景中存在大量的时序数据,这些数据通常具有时序性、高维度、异质性、稀疏性、不等维和不规则等特点。
目前,通常使用基于one-hot向量的序列表示方法,这种表示方法因为稀疏性、高维度等特点,会严重降低相似度计算的效率和准确度。此外,现有方法通常在特定时间段内聚合序列事件,忽视序列中各个事件之间的相对关系以及各个事件与发生时间的相对关系,这会导致时间信息的丢失。从现实场景的角度来看,序列中大多数事件都会随时间的变化而变化,而各个事件的相关关系也会随事件的变化而有所不同,因此时间信息对于事件序列的表示十分重要。
综上,亟需一种新的时序数据相似度度量方法。
发明内容
本发明的目的在于提供时一种时序数据相似度度量方法及度量系统,以解决上述存在的技术问题。本发明通过对时序数据的有效表示,可弥补传统方法忽视数据中事件之间以及事件与发生时间之间相对关系的缺陷,能够对时序数据相似度进行有效度量。
为达到上述目的,本发明采用以下技术方案:
一种时序数据相似度度量方法,包括以下步骤:
步骤1,采集预设数量的样本时序数据,考虑每个样本时序数据中各个事件的相对关系以及各个事件与发生时间的相对关系,将高维空间的数据映射到低维空间,构建出每个样本时序数据的表示;
步骤2,将步骤1获得的所有样本时序数据的表示输入预先设定的卷积神经网络模型,对每个样本时序数据的表示进行特征提取,获得各样本时序数据的特征向量;
步骤3,根据步骤2获得的各样本时序数据的特征向量,基于相似度矩阵计算获得各样本时序数据间的相似度;
步骤4,通过步骤2获得的各样本时序数据的特征向量以及步骤3获得的各样本时序数据间的相似度训练预先设定的卷积神经网络模型,训练至预设收敛条件,获得训练好的相似度度量模型;
步骤5,通过步骤1的方法构建出待度量时序数据的表示,并将其输入步骤4获得的训练好的相似度度量模型中,获得待度量时序数据的相似度度量结果。
进一步地,步骤1具体包括:
步骤1.1,将每条样本时序数据矩阵转换为一个事件序列,按照事件的相对时间排列事件,发生在同一时间的事件不计顺序;
步骤1.2,利用word2vec将每个事件映射成定长的向量,获得事件序列中各个事件包含相对关系信息的向量表示;
步骤1.3,利用word2vec将事件序列中每个事件发生的时间映射成与事件向量等维的向量,获得事件发生时间的向量表示;
步骤1.4,将时序数据中各个事件发生时间的向量表示通过向量加法嵌入到相对应的事件表示中,获得样本时序数据的表示。
进一步地,步骤2中,通过卷积神经网络提取各个样本时序数据的等长的特征向量;
所用的卷积神经网络结构包括:
卷积层,用于接收输入数据,并输出特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910067744.8/2.html,转载请声明来源钻瓜专利网。