[发明专利]基于动态时间弯曲的数据流模式匹配方法在审
申请号: | 201510226281.7 | 申请日: | 2015-05-06 |
公开(公告)号: | CN104850740A | 公开(公告)日: | 2015-08-19 |
发明(设计)人: | 蔡青林;梅寒蕾;陈岭;孙建伶 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于动态时间弯曲的数据流模式匹配方法。首先,通过编码识别数据流转折模式,将数据流分割为包含完整波动趋势的子段;然后,利用第一类切比雪夫多项式分解子段,提取切比雪夫系数作为子段特征;最后,在数据流上基于局部模式匹配进行增量式的动态规划计算,实现快速的数据流模式匹配。本发明在匹配精度和计算效率方面都以较大的程度优于现有的方法,在人们的日常活动和工业生产中可发挥重要作用,如在金融交易、交通管理、气象观测、工业流程监控、医疗诊断等应用中,对大规模采样数据或高速动态数据流进行异常检测、风险监控、自动应答等。 | ||
搜索关键词: | 基于 动态 时间 弯曲 数据流 模式 匹配 方法 | ||
【主权项】:
一种基于动态时间弯曲的数据流模式匹配方法,其特征在于,包括以下步骤:(1)分段特征抽取,具体包括以下子步骤:(1.1)对数据流T做移动平滑处理,得到平滑数据流T';(1.2)基于滑动窗口依次截取T'的相邻3点,并计算平均值,通过判断各点与平均值的大小关系对其编码,得到T的编码序列CT,并定义转折模式表TP_table;(1.3)顺序扫描CT,对每对相邻编码组合查询TP_table中的转折模式,如果模式匹配,则将该编码组合所在位置作为T的分段点,得到子段Si;(1.4)对Si做Z‑规范化处理,得到规范化的子段Si';(1.5)采用第一类切比雪夫多项式分解S'i,计算前a个多项式系数ci作为子段特征,构造子段特征向量V'i=[c1,c2,...,ca];(1.6)扫描完毕,将现有的T切分为X条子段,保存它的分段切比雪夫近似表示PCHA(T)={V'1,...,V'X};(2)在线模式匹配,具体包括以下子步骤:(2.1)根据步骤(1)对查询序列Q做相同处理,将其切分为M条子段,得到Q的分段切比雪夫近似表示PCHA(Q)={V1,...,VM};(2.2)根据实际应用需求设定模式匹配阈值ε,初始化动态规划表
(2.3)计算V1与V'1的距离dist(V1,V'1),记入Table的单元格cell(1,1),作为动态规划最优路径ξ的起始路径点p1,1;(2.4)计算{dist(V2,V'1),dist(V2,V'2),dist(V1,V'2)},通过比较得到三者的最小值min,将min+dist(V1,V'1)记入{cell(2,1),cell(2,2),cell(1,2)}中的相应单元格,作为ξ的第二个路径点;(2.5)假设ξ的当前路径点是pi,j,则计算{dist(Vi+1,V'j),dist(Vi+1,V'j+1),dist(Vi,V'j+1)},并筛选其中最小值min,将min+dist(Vi,V'j)记入{cell(i+1,j),cell(i+1,j+1),cell(i,j+1)}中的相应单元格,作为ξ的最新路径点;(2.6)循环执行步骤(2.5),直至PCHA(Q)完全匹配,得到最优路径ξ={p1,1,…,pM‑1,j,pM,N},N表示与Q匹配的子序列长度;(2.7)比较cell(M,N)与ε的大小,若cell(M,N)≤ε,则将ξ所对应的数据流子序列加入模式匹配结果集R,并以cell(V1,V'N+1)作为下一条最优路径ξ'的起点;若cell(M,N)>ε,则以dist(V1,V'2)作为下一条最优路径ξ'的起点;(2.8)重复执行步骤(2.3)~(2.7)计算ξ',匹配下一条子序列;(2.9)扫描数据流完毕,返回结果集R。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510226281.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于自适应随机共振的参数搜索范围确定方法
- 下一篇:远程智能诊疗装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用