[发明专利]近似保序序列模式挖掘方法在审
申请号: | 202210295950.6 | 申请日: | 2022-03-23 |
公开(公告)号: | CN115033636A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 武优西;刘锦;耿萌;孟玉飞;王珍;杨鸿茜;杨仕琦 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/2458;G06F16/22 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 付长杰 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 近似 序列 模式 挖掘 方法 | ||
1.一种存储可执行指令的一个或多个计算机可读存储介质,当被一个或多个处理器执行时,使所述一个或多个处理器执行以下程序:其特征在于,该程序执行近似保序序列模式挖掘方法,该方法包括下述内容:
输入时间序列S、局部约束δ、全局约束γ和最小支持度阈值minsup;
获得2长度的频繁(δ-γ)保序模式集合fre2,2长度的(δ-γ)保序模式P及其对应的索引存储起来,
采用模式融合策略在长度为L的频繁(δ-γ)保序模式集合freL基础上生成长度为L+1的(δ-γ)候选模式集合candL+1,L≥2;
记录每个长度为L的频繁(δ-γ)保序模式及记录每个频繁(δ-γ)保序模式所对应的索引,同时记录融合成L+1长度的(δ-γ)候选模式P与所对应的融合成该候选模式的两个L长度的频繁(δ-γ)保序模式之间的对应关系;两个L长度的频繁(δ-γ)保序模式按照前后顺序分别记为Pa和Pb,
根据Pa和Pb的索引及出现位置,在模式Pa在时间序列S上出现位置的右边延伸一个元素形成一组候选序列,再在模式Pb在时间序列S上出现位置的左边延伸一个元素形成另一组候选序列,删去两组候选序列中重复的序列,所得到集合就是(δ-γ)候选模式P的所有候选序列;
再通过排序算法将(δ-γ)候选模式P的这些候选序列都转换为相对顺序表示的模式即保序模式,然后将这个(δ-γ)候选模式与它的每个候选序列进行(δ-γ)保序匹配;匹配成功,则(δ-γ)候选模式的支持度加一,并将该候选序列的出现位置记录下来,确定该(δ-γ)候选模式的支持度;
根据(δ-γ)候选模式的支持度与最小支持度阈值minsup的关系确定该(δ-γ)候选模式是否为频繁的(δ-γ)保序模式;
当长度为L的频繁(δ-γ)保序模式集合freL不为空且长度为L+1的(δ-γ)候选模式集合candL+1不为空时,重复上述过程,直到长度为L的频繁(δ-γ)保序模式集合freL为空或长度为L+1的(δ-γ)候选模式集合candL+1为空,完成近似保序序列模式挖掘,提高计算机程序运行时间序列近似保序模式挖掘的效率。
2.根据权利要求1所述的计算机可读存储介质,其特征在于,(δ-γ)保序匹配的具体过程是:将P每个位置的元素值Pi与候选序列对应位置的元素值进行(δ-γ)保序匹配,其中i为不大于模式P长度的自然数,若P在每个位置的元素值Pi与该候选序列对应位置的元素值的局部误差都小于等于局部约束δ,所有位置的局部误差之和小于等于全局约束γ,则匹配成功,该(δ-γ)候选模式的支持度加一,并将该候选序列的出现位置记录下来;如果匹配不成功,则匹配下一个候选序列;当处理完模式P所有的候选序列后,若模式P的支持度大于等于给定的最小支持度阈值minsup,则该(δ-γ)候选模式就是一个频繁的(δ-γ)保序模式,将这个候选模式P放入到长度为L+1的频繁(δ-γ)保序模式集合freL中,并将(δ-γ)候选模式P及其对应的的索引存储起来;如此循环,直到将L+1长度的(δ-γ)候选模式集合candL+1中所有(δ-γ)候选模式处理完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210295950.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种苦荞育苗方法
- 下一篇:一种管道检测方法、系统及终端设备