[发明专利]一种挖掘最大重复序列的方法及装置有效

专利信息
申请号: 201410200896.8 申请日: 2014-05-13
公开(公告)号: CN105095276B 公开(公告)日: 2020-04-21
发明(设计)人: 梁辰;范伟 申请(专利权)人: 华为技术有限公司
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 北京中博世达专利商标代理有限公司 11274 代理人: 张娜
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 挖掘 最大 重复 序列 方法 装置
【权利要求书】:

1.一种挖掘最大重复序列的方法,其特征在于,包括:

获取字符;

将所述字符追加到流水线集合中的每个流水线中,分别判断追加所述字符后的每个流水线中的序列与后缀树上对应的序列是否相同,其中,所述流水线集合包含至少一个流水线,所述流水线包含序列以及位置指针,所述序列包含与所述字符所在的字符串中所述字符之前的字符相同的字符,所述位置指针指向所述流水线包含的序列的尾字符在所述后缀树上的位置;

在所述流水线集合中,若存在第一流水线,在追加所述字符后的序列与后缀树上对应的序列不同,则根据第一预设策略以及所述第一流水线中的序列确定最大重复序列;

其中,所述根据第一预设策略以及所述第一流水线中的序列确定最大重复序列,包括:在所述字符串中,检测与所述第一流水线中的序列相同的序列相邻的左边字符是否为同一种字符,以及,检测与所述第一流水线中的序列相同的序列相邻的右边字符是否为同一种字符;若与所述第一流水线中的序列相同的序列相邻的左边字符不为同一种字符,且与所述第一流水线中的序列相同的序列相邻的右边字符不为同一种字符,则确定所述第一流水线中的序列为最大重复子序列;若与所述第一流水线中的序列相同的序列相邻的左边字符为同一种字符,或者,与所述第一流水线中的序列相同的序列相邻的右边字符为同一种字符,或者,与所述第一流水线中的序列相同的序列相邻的左边字符为同一种字符以及与所述第一流水线中的序列相同的序列相邻的右边字符为同一种字符,则确定所述第一流水线中的序列不是最大重复序列,并销毁所述第一流水线;同时,在所述流水线集合中,若存在第二流水线,根据所述第二流水线的位置指针以及第二预设策略确定最大非串联重复序列;以使得所挖掘的最大重复序列为非串联重复序列;

确定所述第二流水线的参考流水线中的序列为由所述第二流水线中的序列组成的串联序列,销毁第二流水线以及第二流水线的参考流水线。

2.根据权利要求1所述的方法,其特征在于,所述在所述字符串中,检测与所述第一流水线中的序列相同的序列相邻的左边字符是否为同一种字符,以及,检测与所述第一流水线中的序列相同的序列相邻的右边字符是否为同一种字符,包括:

在所述字符串中,获取与所述第一流水线中的序列相同的序列相邻的左边字符集;若所述字符集包含同一种字符,则确定与所述第一流水线中的序列相同的序列相邻的左边字符为同一种字符;若所述字符集包含至少两种字符,则确定与所述第一流水线中的序列相同的序列相邻的左边字符不为同一种字符;

在所述后缀树上,判断所述第一流水线的位置指针所指字符与所述字符是否相同,若相同,则确定与所述第一流水线中的序列相同的序列相邻的右边字符为同一种字符,若不同,则确定与所述第一流水线中的序列相同的序列相邻的右边字符不为同一种字符。

3.根据权利要求1-2任一项所述的方法,其特征在于,所述分别判断追加所述字符后的每个流水线中的序列与后缀树上对应的序列是否相同,包括:

在所述后缀树上,分别移动每个流水线中的位置指针,使所述位置指针指向与所述流水线包含的序列的尾字符相邻的下一个字符的位置;

判断移动后的所述位置指针指向的字符与所述字符是否相同;若不同,则确定追加所述字符后的流水线中的序列与后缀树上对应的序列不同;若相同,则确定追加所述字符后的流水线中的序列与后缀树上对应的序列相同。

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

在所述流水线集合中,若存在第二流水线,在追加所述字符后的序列与后缀树上对应的序列相同,则将所述字符追加到所述第二流水线中,并将所述第二流水线的位置指针指向追加所述字符后的所述第二流水线包含的序列的尾字符在所述后缀树上的位置;

根据所述第二流水线的位置指针以及第二预设策略确定最大非串联重复序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410200896.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top