[发明专利]保序序列规则挖掘方法在审

专利信息
申请号: 202110306575.6 申请日: 2021-03-23
公开(公告)号: CN112905689A 公开(公告)日: 2021-06-04
发明(设计)人: 武优西;赵晓倩;李艳;马鹏飞;耿萌;谢婷萱;杨克帅 申请(专利权)人: 河北工业大学
主分类号: G06F16/26 分类号: G06F16/26;G06F16/2455;G06F16/22
代理公司: 天津翰林知识产权代理事务所(普通合伙) 12210 代理人: 付长杰
地址: 300130 天津市红桥区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 序列 规则 挖掘 方法
【说明书】:

发明为保序序列规则挖掘方法,该挖掘方法包括以下内容:获得对应时间序列的所有频繁保序序列模式,构成频繁保序序列模式集合,设定最小置信度阈值minconf,计算频繁保序序列模式y的前缀子模式x,若前缀子模式的相对顺序为频繁保序序列模式,则得到保序序列规则x=y,迭代上述过程,得到所有的保序序列规则;根据conf(x=y)=sup(y)/sup(x)计算x=y的置信度,最终将置信度≥设定的最小置信度阈值minconf的保序序列规则加入到规则集合R中,小于minconf的保序序列规则称为强保序序列规则,挖掘所有的强保序序列规则称为保序序列规则挖掘。本发明实现了高效的频繁保序序列模式挖掘,之后在对频繁保序序列模式进行保序序列规则挖掘,寻找模式之间隐含的关系。

技术领域

本发明的技术方案涉及电数字数据处理技术领域,具体地说是保序序列规则挖掘方法。

背景技术

当今是一个大数据时代,由此产生诸多新问题,众多学者从多角度对大数据进行研究,该研究的核心就是从大量的数据中挖掘有价值的信息即数据挖掘。现如今,数据挖掘已经被广泛应用于生物医学、金融市场、互联网等众多领域。序列模式挖掘作为数据挖掘领域非常重要的研究课题,长期以来受到了广泛的关注。为了解决各种各样的问题,序列模式挖掘衍生出了多种挖掘方法,如负序列模式挖掘可以避免频繁但存在缺失项的丢失,对比序列模式挖掘可以提高分类的精度,间隙约束的序列模式挖掘可以更加灵活地挖掘满足特定需要的模式,Top-k序列模式挖掘可以避免挖掘过程中设置参数的不合理造成模式的丢失。

然而现有的序列模式挖掘方法大多针对字符序列,由于时间序列具有高维性和连续性的特点,很难直接应用到时间序列分析中。在最初的研究中,通常会把原始的时间序列转化为其他域的数据来进行降维。最常用到的方法有分段化表示法、符号化表示法等,由于这些方法在挖掘过程中需要人为设定参数,因此,容易丢失重要的信息。同时,对于时间序列数据,如果过度关注元素数据的大小,则很容易忽视序列的形态变化,难以发现有价值的信息。为了解决上述问题,提出了保序序列模式匹配,保序序列模式关注的是序列的相对顺序而不是序列中元素的绝对值的大小,当子序列的相对顺序与给定的模式一致时,代表匹配成功。下例A对相对顺序以及保序序列模式匹配问题进行了详细介绍。

例A.给定时间序列t=(t1,t2,t3,t4,t5,t6,t7,t8,t9,t10,t11,t12)=(17,10,6,12,5,26,19,21,16,25,11,15),模式p=(p1,p2,p3,p4)=(16,23,14,30)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110306575.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top