[发明专利]编索引成形图创建有效

专利信息
申请号: 201380075352.7 申请日: 2013-01-31
公开(公告)号: CN105074689A 公开(公告)日: 2015-11-18
发明(设计)人: Q.林;J.谢;D.李 申请(专利权)人: 惠普发展公司;有限责任合伙企业
主分类号: G06F17/00 分类号: G06F17/00;G06F9/06
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 张凌苗;陈岚
地址: 美国德*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 索引 成形 创建
【说明书】:

背景技术

数据结构可以包括多个字符的表示。可以遍历(traverse)数据结构来提取多个字符。数据结构可能需要与多个字符的编索引和查找相关联的存储器资源和处理资源。

二叉树可以是存储多个字符的数据结构,使得二叉树可以被遍历以检索字符的串。然而,随着存储在二叉树中的字符的串的大小增加,用于存储字符的串的存储器分配也增加。减少被分配以存储二叉树中的信息的存储器而不丢失信息可以提供比二叉树更有效率的数据结构。

附图说明

图1A是图示了根据本公开的位串列表的示例的图。

图1B是图示了根据本公开的二叉树的示例的图。

图1C是图示了根据本公开的编索引的成形图(indexedshapedgraph)的示例的图。

图2A是图示了根据本公开的位串列表的示例的图。

图2B是图示了根据本公开的包括公共前缀的二叉树的示例的图。

图2C是图示了根据本公开的包括公共前缀的编索引的成形图的示例的图。

图3A是图示了根据本公开的切分标记(token)列表的示例的图。

图3B是图示了根据本公开的切分压缩的示例的图。

图4是图示了根据本公开的查询查找的示例的流程图。

图5是图示了根据本公开的用于编索引的成形图创建的方法的示例的流程图。

图6是图示了根据本公开的计算系统的示例的图。

具体实施方式

数据结构的使用可以与存储器资源和处理资源相关联。例如,数据结构可以存在于存储器中并且由数据结构占用的存储器的量可以与同数据结构相关联的数据的类型和/或信息的大小成比例。处理资源可以基于从数据结构检索信息所需的处理资源而与数据结构相关联。减少构造数据结构和从数据结构检索信息需要的存储器资源和处理资源的大小可以影响数据结构的效率并且可以提供同与存储器资源和/或处理资源的较大使用相关联的数据结构相比更好的替代方案。

如本文使用的那样,数据结构可以是在存储器中的信息的组织。可以通过用于存储信息的组织方案来区分数据结构。信息可以指除其他数据类型之外的串和/或整数,例如文本和/或数字。可以将信息以标记的形式存储在数据结构中。可以将信息划分成标记,例如标记化(tokenize),使得多个标记与多个字符相关联。例如,可以将串“abc”标记化成表示字符“a”的第一标记、表示字符“b”的第二标记以及表示字母“c”的第三标记。可以将标记存储在数据结构中。

在先前的方法中,可以使用例如数据结构的二叉树来存储标记的多个列表,例如信息。然而,可以通过使形状与二叉树相关联并且浓缩具有相似形状的二叉树的部分以创建成形图来减少与在二叉树中存储标记的多个列表相关联的存储器资源和处理资源。成形图可以被编索引以适应在成形图上的查找能力。当为成形图编索引时创建了编索引的成形图。

在本公开中,参考形成本文的一部分的附图,并且其中通过图示的方式示出可以如何实行本公开的多个示例。以足够的细节描述了这些示例以使本领域普通技术人员能够实行该公开的示例,并且应理解可以使用其他示例并且可以做出过程、电和/或结构改变而不脱离本公开的范围。

本文的图遵循编号约定,其中第一个数字对应于绘图编号并且剩余的数字标识图中的元素或者部件。可以添加、交换和/或消除在本文的各种图中示出的元素从而提供本公开的多个附加示例。此外,在图中提供的元素的比例和相对比例意图图示本公开的示例,并且不应该被在限制性的意义上理解。

图1A是图示了根据本公开的位串列表102的示例的图。位串列表102包括具有相关联的位串标识(ID)“P1”的第一位串“0”、具有相关联的位串ID“P2”的第二位串“001”、具有相关联的位串ID“P3”的第三位串“010”、具有相关联的位串ID“P4”的第四位串“101”以及具有相关联的位串ID“P5”的第五位串“110”。

如本文使用的那样,位串可以表示二进制形式的信息。例如,二进制“0”可以表示十进制数字0、二进制“001”可以表示十进制数字1、二进制“010”可以表示十进制数字2、二进制“101”可以表示十进制数字5,并且二进制“110”可以表示十进制数字6。可以标记化位串使得在位串中每个字符,例如“0”或者“1”与标记相关联。标记的列表可以表示位串。例如,二进制“101”可以由表示“1”的第一标记、表示“0”的第二标记和表示“1”的第三标记表示。第一标记、第二标记和第三标记可以组成表示二进制“101”的标记的列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380075352.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top