[发明专利]保序序列规则挖掘方法在审
申请号: | 202110306575.6 | 申请日: | 2021-03-23 |
公开(公告)号: | CN112905689A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 武优西;赵晓倩;李艳;马鹏飞;耿萌;谢婷萱;杨克帅 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/2455;G06F16/22 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 付长杰 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列 规则 挖掘 方法 | ||
本发明为保序序列规则挖掘方法,该挖掘方法包括以下内容:获得对应时间序列的所有频繁保序序列模式,构成频繁保序序列模式集合,设定最小置信度阈值minconf,计算频繁保序序列模式y的前缀子模式x,若前缀子模式的相对顺序为频繁保序序列模式,则得到保序序列规则x=y,迭代上述过程,得到所有的保序序列规则;根据conf(x=y)=sup(y)/sup(x)计算x=y的置信度,最终将置信度≥设定的最小置信度阈值minconf的保序序列规则加入到规则集合R中,小于minconf的保序序列规则称为强保序序列规则,挖掘所有的强保序序列规则称为保序序列规则挖掘。本发明实现了高效的频繁保序序列模式挖掘,之后在对频繁保序序列模式进行保序序列规则挖掘,寻找模式之间隐含的关系。
技术领域
本发明的技术方案涉及电数字数据处理技术领域,具体地说是保序序列规则挖掘方法。
背景技术
当今是一个大数据时代,由此产生诸多新问题,众多学者从多角度对大数据进行研究,该研究的核心就是从大量的数据中挖掘有价值的信息即数据挖掘。现如今,数据挖掘已经被广泛应用于生物医学、金融市场、互联网等众多领域。序列模式挖掘作为数据挖掘领域非常重要的研究课题,长期以来受到了广泛的关注。为了解决各种各样的问题,序列模式挖掘衍生出了多种挖掘方法,如负序列模式挖掘可以避免频繁但存在缺失项的丢失,对比序列模式挖掘可以提高分类的精度,间隙约束的序列模式挖掘可以更加灵活地挖掘满足特定需要的模式,Top-k序列模式挖掘可以避免挖掘过程中设置参数的不合理造成模式的丢失。
然而现有的序列模式挖掘方法大多针对字符序列,由于时间序列具有高维性和连续性的特点,很难直接应用到时间序列分析中。在最初的研究中,通常会把原始的时间序列转化为其他域的数据来进行降维。最常用到的方法有分段化表示法、符号化表示法等,由于这些方法在挖掘过程中需要人为设定参数,因此,容易丢失重要的信息。同时,对于时间序列数据,如果过度关注元素数据的大小,则很容易忽视序列的形态变化,难以发现有价值的信息。为了解决上述问题,提出了保序序列模式匹配,保序序列模式关注的是序列的相对顺序而不是序列中元素的绝对值的大小,当子序列的相对顺序与给定的模式一致时,代表匹配成功。下例A对相对顺序以及保序序列模式匹配问题进行了详细介绍。
例A.给定时间序列t=(t1,t2,t3,t4,t5,t6,t7,t8,t9,t10,t11,t12)=(17,10,6,12,5,26,19,21,16,25,11,15),模式p=(p1,p2,p3,p4)=(16,23,14,30)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110306575.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可横纵两向安装轴承的压力机
- 下一篇:条材异形端倒角加工设备