[发明专利]无重叠的带弱通配符的序列模式匹配方法在审
申请号: | 202010544301.6 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111680195A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 李艳;罗岚方;武优西;刘靖宇;朱希康;李萧言;李浩鹏 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 胡安朋 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重叠 通配符 序列 模式 匹配 方法 | ||
本发明无重叠的带弱通配符的序列模式匹配方法,涉及电数字数据处理技术领域,该方法利用队列结构来解决无重叠的带弱通配符的序列模式匹配问题,该方法采用深度优先和回溯策略,实现了无重叠的带弱通配符的序列模式匹配,步骤是,确定给定序列模式的队列个数;计算队列1末尾的结点范围;采用深度优先和回溯策略创建队列末尾的结点;标记序列模式P在序列S中的一个出现;结束队列中的结点创建。本发明克服了现有技术针对具有间隙约束的无重叠带弱通配符的序列模式匹配问题,存在很难兼顾求解完备性和有效的控制时间开销和空间开销的缺陷。
技术领域
本发明的技术方案涉及电数字数据处理技术领域,具体地说是无重叠的带弱通配符的序列模式匹配方法。
背景技术
时间序列是按时间次序排列的一组观测值的集合,随着计算机科学与技术的不断发展,时间序列扮演着越来越重要的作用,比如股票、天气时间序列中隐含了大量潜在的有意义和有用的信息和知识,但是直接从时间序列中提取出有用的信息非常困难,并且时间序列的波动趋势对用户采取决策或预测未来走势非常重要,因此需要根据时间序列的波动趋势转换为字符序列,模式挖掘就是从大量的字符数据中提取有意义和有用的信息,其中频繁模式挖掘是指从大量字符数据中找出满足最小支持度阈值的频繁出现的模式,其主要任务是模式匹配,因为频繁模式挖掘通常需要计算一个模式的支持度,而支持度计算的实质就是模式匹配问题,因此,模式匹配是频繁模式挖掘的基础与核心,随着科学技术的发展,模式匹配已成为计算机科学中的一个重要研究方向,并且是许多工作的研究基础。
模式匹配是指在序列S中查找与模式P相同或者相似的子序列的过程,其发展趋势主要有以下几种:①从传统的模式匹配到具有间隙约束的序列模式匹配;②从具有间隙约束的序列模式匹配到具有弱通配符的序列模式匹配;③从无特殊条件下具有弱通配符的序列模式匹配到一次性条件下具有弱通配符的序列模式匹配,再到无重叠条件下具有弱通配符的序列模式匹配。
在模式匹配问题中引入间隙约束,能使得问题求解更加灵活,并且能够处理具有噪声和误差的序列,下例A对具有间隙约束的序列模式匹配问题进行了详细说明。
例A.给定序列S=s1s2s3s4s5s6s7s8s9=BBOOBOBaO,序列模式P=p1[min1,max1]p2[min2,max2]p3=B[0,3]B[0,3]O。
具有间隙约束的序列模式P表示为p1[min1,max1]p2…pj[minj,maxj]pj+1…[minm-1,maxm-1]pm,其中,minj和maxj分别表示子模式pj和子模式pj+1之间能够匹配的通配符的最小个数和最大个数,区间[minj,maxj]称为间隙约束,当序列模式中min1=min2=…=minm-1=min并且max1=max2=…=maxm-1=max时,称为周期间隙约束,具有周期间隙约束的序列模式P简记为p1p2…pm,周期间隙约束gap=[min,max],m表示序列模式P的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010544301.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车拉杆后悬置结构
- 下一篇:一种新型后悬减振器支柱结构