[发明专利]保序序列规则挖掘方法在审
申请号: | 202110306575.6 | 申请日: | 2021-03-23 |
公开(公告)号: | CN112905689A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 武优西;赵晓倩;李艳;马鹏飞;耿萌;谢婷萱;杨克帅 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/2455;G06F16/22 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 付长杰 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列 规则 挖掘 方法 | ||
1.一种保序序列规则挖掘方法,其特征在于,该挖掘方法包括以下内容:
获得对应时间序列的所有频繁保序序列模式,构成频繁保序序列模式集合,
设定最小置信度阈值minconf,
计算频繁保序序列模式y的前缀子模式x,若前缀子模式的相对顺序为频繁保序序列模式,即前缀子模式的相对顺序也为上述获得的频繁保序序列模式集合中的元素,则得到保序序列规则x=y,表示在序列中若x出现,那么y将以大概率出现;迭代上述过程,得到所有的保序序列规则;
根据conf(x=y)=sup(y)/sup(x)计算x=y的置信度,sup(y)表示y的支持度,sup(x)表示x的支持度,最终将置信度≥设定的最小置信度阈值minconf的保序序列规则加入到规则集合R中,小于minconf的保序序列规则称为强保序序列规则,挖掘所有的强保序序列规则称为保序序列规则挖掘,即实现保序序列规则挖掘。
2.一种保序序列模式挖掘方法,其特征在于,该挖掘方法包括利用模式融合和剪枝策略生成候选模式,计算支持度时依据子模式匹配的结果获得超模式的匹配情况;
获得2长度的频繁保序序列模式集合F2及其对应的位置集合Pos2;
生成m+1长度的候选模式,由m长度的频繁保序序列模式集Fm对应的子模式位置集合Posm生成m+1长度子模式位置集合Posm+1,其中m表示当前得到的频繁保序序列模式长度,m的初始值为2,生成m+1长度的模式r的匹配的位置集合为Lr,
位置集合的计算方式有以下两种情况:
1)一般情况:对于两个m长度的频繁保序序列模式p和频繁保序序列模式q,频繁保序序列模式p的每个元素分别为元素p1、元素p2、…、元素pm,频繁保序序列模式q的每个元素分别为元素q1、元素q2、…、元素qm,当频繁保序序列模式q的前缀子模式的相对顺序和频繁保序序列模式p的后缀子模式的相对顺序一致,但是频繁保序序列模式q的最后一位qm和频繁保序序列模式p的第一位p1不相等时,生成一个m+1长度候选模式,频繁保序序列模式p对应的位置集合Lp中的元素分别为元素lp1、元素lp2、…、元素lps,其中s为位置集合Lp中元素的个数,频繁保序序列模式q对应的位置集合Lq中的元素分别元素lq1、元素lq2、…、元素lqv,其中v为位置集合Lq中元素的个数,生成的m+1长度的候选模式对应的位置集合表示为Lr,集合Lr中的元素分别为集合中的元素分别为元素lr1、元素lr2、…、元素lrt、…、元素lru,其中u为得到的位置集合Lr中元素的个数,计算位置集合Lr中的元素lrt(1≤t≤u)值的方式如下:
分别从第一个位置遍历位置集合Lp和位置集合Lq中的元素,若lqb=lpa+1(其中lpa为位置集合Lp中的元素,lqb为位置集合Lq中的元素),则lrt=lqb,将所有满足上述关系的元素加入到位置集合Lr中,最终得到的位置集合Lr即为m+1长度候选模式在序列t中匹配的位置集合;
2)特殊情况:对于两个m长度的频繁保序序列模式p和频繁保序序列模式q,频繁保序序列模式p的每个元素分别为元素p1、元素p2、…、元素pm,频繁保序序列模式q的每个元素分别为元素q1、元素q2、…、元素qm,当频繁保序序列模式q的前缀子模式的相对顺序和频繁保序序列模式p的后缀子模式的相对顺序一致,并且频繁保序序列模式q的最后一位qm和频繁保序序列模式p的第一位p1相等时,频繁保序序列模式p和频繁保序序列模式q通过模式融合得到2个m+1长度的候选模式r和z,频繁保序序列模式p对应的位置集合Lp中的元素分别为元素lp1、元素lp2、…、元素lps,其中s为位置集合Lp中元素的个数,频繁保序序列模式q对应的位置集合Lq中的元素分别元素lq1、元素lq2、…、元素lqv,其中v为位置集合Lq中元素的个数,生成的候选模式对应的位置集合为Lr,Lz,模式r对应的集合Lr中的元素分别为元素lr1、元素lr2、…、元素lrt、…、元素lru,其中u为得到的位置集合Lr中元素的个数,模式z对应的位置集合Lz中的元素分别为元素lz1、元素lz2、…、元素lzg、…、元素lzw,其中w为得到的位置集合Lz中元素的个数,计算位置集合Lr中的元素lrt(1≤t≤u)值和位置集合Lz中的元素lzg(1≤g≤w)的方式如下:
分别从第一个元素遍历位置集合Lp和位置集合Lq中的元素,若lqb=lpa+1,其中lpa为位置集合Lp中的任意元素,lqb为位置集合Lq中的任意元素,接下来需要判断给定的时间序列t中元素tfirst和元素tend的大小,其中first=lqb-m,end=lqb,若tfirsttend,则lrt=lqb,将所有满足上述关系的元素加入到位置集合Lr中,最终得到的集合Lr即为m+1长度候选模式r匹配的位置集合;若tfirsttend,则lzg=lqb,将所有满足上述关系的元素加入到位置集合Lz中,最终得到的集合Lz即为m+1长度候选模式z匹配的位置集合;
上述获得的与相应候选模式匹配的位置集合中元素的个数即为对应候选模式的支持度,根据支持度判断其是否是频繁保序序列模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110306575.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可横纵两向安装轴承的压力机
- 下一篇:条材异形端倒角加工设备