[发明专利]具有局部-整体约束的无重叠近似模式匹配方法有效

专利信息
申请号: 201910530671.1 申请日: 2019-06-19
公开(公告)号: CN110245167B 公开(公告)日: 2021-08-03
发明(设计)人: 武优西;菅博境;刘茜;王月华;成淑慧;王阳阳;赵苏颖 申请(专利权)人: 河北工业大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/22;G06F16/903;G06F16/901
代理公司: 天津翰林知识产权代理事务所(普通合伙) 12210 代理人: 胡安朋
地址: 300130 天津市红桥区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 具有 局部 整体 约束 重叠 近似 模式 匹配 方法
【说明书】:

发明具有局部‑整体约束的无重叠近似模式匹配方法,涉及电数字数据处理技术领域,利用网树结构来解决(δ,γ)‑距离下的无重叠近似模式匹配问题,首先读入序列S、模式P、局部阈值δ和整体阈值γ,根据输入条件创建一棵网树,然后从最后一个根结点开始,判断是否存在满足局部‑整体约束的树根叶子路径,最后从叶子层开始,根据最右双亲策略回溯出一条出现,迭代此过程,直到第一个根结点。本发明克服了现有技术针对具有局部‑整体约束的无重叠近似模式匹配问题,存在很难兼顾求解的准确性、一般性和灵活性,以及在保证结果集非冗余的同时能够保留下有价值的信息的缺陷。

技术领域

本发明的技术方案涉及电数字数据处理技术领域,具体地说是具有局部-整体约束的无重叠近似模式匹配方法。

背景技术

大数据时代已到来,从海量数据中挖掘出有价值的信息已成为新的研究热点,频繁模式挖掘是指从大量数据中找出频繁出现的模式,其主要任务是模式匹配,因为频繁模式挖掘通常需要计算一个模式的支持度,而支持度计算的实质就是模式匹配问题,因此,模式匹配是频繁模式挖掘的基础与核心,随着科学技术的发展,模式匹配已成为计算机科学中的一个重要研究方向,并且是许多工作的研究基础,不仅应用于简单的时间序列匹配,还应用于简单的生物序列匹配。

模式匹配是指在序列S中查找与模式P相同或者相似的子序列的过程,其发展趋势主要有以下几种:①从传统的模式匹配到具有间隙约束的模式匹配;②从具有间隙约束的精确模式匹配到具有间隙约束的近似模式匹配;③从无特殊条件下的近似模式匹配到一次性条件下的近似模式匹配,再到无重叠条件下的近似模式匹配。

在模式匹配问题中引入间隙约束,能使得问题求解更加灵活,并且能够避免匹配到无意义的模式,下例A对具有间隙约束的模式匹配问题进行了详细说明。

例A.给定序列S=s1s2s3s4s5=acaba,模式P=p1[min1,max1]p2[min2,max2]p3=a[0,2]b[0,1]a。

具有间隙约束的模式P表示为p1[min1,max1]p2…pj[minj,maxj]pj+1…[minm-1,maxm-1]pm,其中,minj和maxj分别表示子模式pj和子模式pj+1之间能够匹配的通配符的最小个数和最大个数,区间[minj,maxj]称为间隙约束,m表示模式串的长度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910530671.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top