[发明专利]一种健康体检生理时间序列数据的可视化表示方法、存储介质在审
申请号: | 201711283984.9 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108304446A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 潘国栋;霍晓军;吴栋;周琳;戚伟;孟纪元;赵磊;王建安;李永;孙朝阳;张延莉;马卫 | 申请(专利权)人: | 河南电力医院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G16H10/00 |
代理公司: | 郑州中原专利事务所有限公司 41109 | 代理人: | 李想 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂网络 时间序列 转移矩阵 时间序列数据 可视化表示 可视化 离散化 有向图 体检 图形化表示 存储介质 高斯分布 矩阵转化 邻接矩阵 转移概率 等概率 子区间 映射 构建 权重 标准化 健康 挖掘 | ||
本发明提供一种健康体检生理时间序列数据的可视化表示方法,包括(1)SAX离散化:将长度为L的原始时间序列T进行标准化后划分为L/n个子区间,对每个子区间计算均值,然后使用SAX方法中的对应等概率高斯分布区间映射为相应的a个字符,即对应离散的a个区间;(2)构建马尔科夫转移矩阵:计算所述a个区间上的转移概率,得到a×a马尔科夫转移矩阵;(3)可视化:将所述a×a马尔科夫转移矩阵作为a×a带权重的邻接矩阵,得到a个节点的有向图复杂网络,采用可视化工具对所述有向图复杂网络进行图形化表示。本发明首次提出了将基于SAX的离散化方法用于时间序列的马尔科夫矩阵转化;首次将复杂网络与时间序列挖掘结合起来。
技术领域
本发明涉及一种健康体检生理时间序列数据的可视化表示方法。
背景技术
时间序列数据广泛存在于科学研究、生产过程与金融服务等领域中,尤其是近年来随着信息技术的应用与发展,时间序列数据也呈现出爆发性增长的趋势,海量的数据处理与应用工作日益增多。对于健康体检领域来讲,ECG等时间序列是非常常见的生理数据。时间序列数据通常具有高维的特征,而且由于在产生过程中环境因素的影响,极易存在一定的噪声。因此,对于此类复杂数据进行研究,从而有效地挖掘和获取信息与知识,无论对于科学理论研究还是社会生产实践都具有重要的价值与意义。
在大量的与时间序列数据有关的问题中,人们试图研究物理现象随时间动态变化的过程,并期望对时间序列数据进行分类、模式发现等任务处理。在对时间序列数据进行处理分析的过程中,时间序列数据的可视化是较为有效的方法之一,该方法将时间序列数据映射为可视图像或直观图形符号,这种映射大大方便了对原始数据的分析和解释过程,有利于揭示隐藏在数据中不易被直观发现的复杂物理现象。然而,数据测量、收集或求解过程所得到的数据量往往是海量的,由于时间序列具有高维特性,而且数据中往往存在大量的噪声信息,因此在数据挖掘和知识获取过程中,为了减少计算代价、提高数据挖掘与信息获取效率,往往需要对原始数据采用某种特征表示方法进行特征提取,以便于将原始时间序列数据映射到新的低维特征空间中,从而在保持和反映基本形态和信息的前提下,达到数据降维、去除噪声的目的。
特征是隐含在数据集合中的任何有助于解释相应物理现象的信息。基于特征的表示方法是一种更简洁、更清晰、更具含义的代替原始数据的高级表示方法,所抽取的特征用于进一步分析及可视化过程。以可视化的方式来展现时间序列的预测结果可为终端用户带来极大的便利,为此,时间序列数据预测的可视化研究也成为热点之一。通过使用恰当的可视化方式可以对各种数据进行可视化处理,可视化后的数据,将使用户可以直观地发现数据特征与数据隐含的依赖关系,为数据分析人员提供很好的帮助。
作为时间序列数据挖掘与分析处理任务的基础,时间序列的特征表示和相似性度量是热点问题之一。Pazzani和Agrawal研究小组较早开展相关的研究,UCR的Keogh小组做出了一系列创造性的研究工作。目前在该领域的研究过程中,已产生较多种特征提取及表示方法,如基于域变换的表示方法、符号化表示方法以及分段线性表示方法等。
在已有的时间序列数据可视化研究方法中,Andriana S.L.O.Campanharo,M.Irmak Sirer,R.Dean Malmgren,Fernando M.Ramos,Lu1′s A.Nunes Amaral于2011年所提出并发表在PLoS ONE上的方法较为新颖简洁直观,该方法基于分位数算法将时间序列进行离散化特征表示,然后将其与网络图及马尔科夫转移矩阵相结合,在原始序列、离散化特征表示、网路图、转移概率矩阵之间建立联系,在时间序列与网络图之间建立关联,从而可以对时间序列进行网络化表示,进而以图的方式进行可视化展示。该方法的基本原理与过程如图1所示。
图1所示的方法中分位数离散化的过程是,首先将根据时间序列的值域划分为a个区间,然后计算时间序列在这a个区间上的转移概率,随后将每个区间作为一个节点,转移概率作为权值,然后采用一定的算法将其转换为网络图,从而得到可视化的图形表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南电力医院,未经河南电力医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711283984.9/2.html,转载请声明来源钻瓜专利网。