[发明专利]一次性条件的负序列模式挖掘方法在审

专利信息
申请号: 202110417286.3 申请日: 2021-04-19
公开(公告)号: CN113076356A 公开(公告)日: 2021-07-06
发明(设计)人: 武优西;陈明婕;王月华;王珠林;赵晓倩;孟玉飞 申请(专利权)人: 河北工业大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06N5/02
代理公司: 天津翰林知识产权代理事务所(普通合伙) 12210 代理人: 付长杰;张国荣
地址: 300130 天津市红桥区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一次性 条件 序列 模式 挖掘 方法
【说明书】:

发明为一次性条件的负序列模式挖掘方法,包括第一步、读入序列数据库、最小支持度阈值及间隙约束;第二步、生成模式长度为1的频繁正序列模式集F1;第三步、生成模式长度为i+1的正序列候选模式并计算支持度,将满足条件的正序列候选模式加入到频繁正序列模式集Fi+1;第四步、将序列数据库中的各个字符作为负元素依次插入到频繁正序列模式集Fi+1的各个频繁正序列模式中,得到负序列候选模式并计算支持度,将满足条件的负序列候选模式加入到频繁负序列模式集;重复第三步和第四步,直到没有新的正序列候选模式生成,挖掘结束,输出所有一次性条件的负序列模式。该方法克服了现有的负序列模式挖掘忽略间隙约束和重复性的问题。

技术领域

本发明涉及序列模式分析技术领域,具体地说是一次性条件的负序列模式挖掘方法。

背景技术

随着计算机技术的飞速发展,信息化时代已然到来,随之而来的还有海量的数据,如何充分利用这些数据从中找出有用的信息是当前研究的热点问题之一,为解决这一问题,数据挖掘这一课题随之产生。数据挖掘的目的在于运用统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等方法,从大量的数据中找出隐藏于其中的信息,其中序列模式挖掘是数据挖掘的一个重要分支,序列模式挖掘被广泛应用于多个领域,不仅限于生物医疗领域的应用,还应用于商业推广和金融等领域。

在序列模式挖掘中,不仅希望从中获得有效的信息,更希望能从中得到用户要求的感兴趣信息,因此在序列模式挖掘中增加了间隙约束。间隙约束可以根据需求挖掘出用户需要的模式,并缩小挖掘范围,提高挖掘效率。

此外,序列模式挖掘的核心问题是模式匹配,以例A为例,详细说明具有间隙约束的序列模式。

例A.给定模式p=p1[min1,max1]p2[min2,max2]p3=b[0,1]a[0,1]b。

具有间隙约束的模式p=p1[min1,max1]p2...[minj-1,maxj-1]pj[minj,maxj]pj+1...[minm-1,maxm-1]pm,(0≤minj≤maxj),其中minj和maxj为整数,是模式p的间隙约束,分别表示pj-1和pj之间通配符的最小和最大个数,pj∈E,E为字符集,m是模式p的模式长度。当模式中min1=min2=…=minm-1,max1=max2=…=maxm-1时,该间隙约束为周期间隙约束,此时模式p可以简单表示为p=p1p2...pj…pm,gap=[min,max]。

例A中,模式p=b[0,1]a[0,1]b是一个具有周期间隙约束的模式,模式长度为3,字符集E={a,b},模式p可以简单表示为p=bab,gap=[0,1],其中0表示b与a之间、a与b之间至少需要匹配0个通配符,1表示b与a之间、a与b之间最多匹配1个通配符。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110417286.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top