[发明专利]一种集合操作方法及终端在审
| 申请号: | 201811572175.4 | 申请日: | 2018-12-21 |
| 公开(公告)号: | CN109800241A | 公开(公告)日: | 2019-05-24 |
| 发明(设计)人: | 朱智佳;潘登;常鹏;张文跃;张焕平;曾梅月 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
| 主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/22 |
| 代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郝学江 |
| 地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 集合 单向循环 终端 数据处理领域 编号生成 父亲节点 元素数据 重复执行 不相交 映射表 有效地 遍历 向量 存储 记录 | ||
本发明涉及数据处理领域,尤其涉及一种集合操作方法及终端。本发明通过使用并查集存储两个以上集合;为所述并查集中的每一元素设置对应的编号,得到元素数据映射表;记录所述并查集中每一元素的父亲节点的编号,得到第一向量;根据一所述集合中的中每一元素对应的编号生成一单向循环列表;重复执行步骤S4,直至所述两个以上集合被遍历,得到两个以上所述单向循环列表。实现有效地提高不相交集合间操作的效率。
技术领域
本发明涉及数据处理领域,尤其涉及一种集合操作方法及终端。
背景技术
计算机很多软件中,经常有涉及到集合操作的算法。其中有一种应用场景,如机器学习中的样本数据分类,又如社交软件中的朋友圈关系,都需要对数据进行分类聚合,即对由不相交集合组成的数据,需要做集合的查找,合并,删除等需求操作。
在众多计算机软件编程语言,一般都可以用hash表或者平衡树来实现集合的通用操作,但是这种集合实现方法,合并操作比较耗时。两个集合合并过程需要把一个集合的数据遍历复制到另外一个集合。为了高效对两个集合进行合并,算法大师Bernard Galler和Michael John Fischer提出了并查集的数据结构。并查集,是用一棵树表示一个集合,这样合并的时候只要对两棵树进行合并。两棵树合并,只需要对其中一棵树的根当做另外一棵树的节点即可。这样合并操作就可以变成非常高效,只要O(1)即可。但是,使用并查集的数据结构存在以下不足:
1、并查集采用节点只记录父亲节点的存储方式,导致遍历一个棵树变得困难,即没办法查询一个元素所在集合的其它所有元素;
2、不能执行删除操作,即集合合并后,无法对集合进行拆分;
3、集合元素只能整型类型,不支持其它数据类型的元素。
发明内容
本发明所要解决的技术问题是:如何提高不相交集合间操作的效率。
为了解决上述技术问题,本发明采用的技术方案为:
本发明提供一种集合操作方法,包括:
S1、使用并查集存储两个以上集合;
S2、为所述并查集中的每一元素设置对应的编号,得到元素数据映射表;
S3、记录所述并查集中每一元素的父亲节点的编号,得到第一向量;
S4、根据一所述集合中的每一元素对应的编号生成一单向循环列表;
S5、重复执行步骤S4,直至所述两个以上集合被遍历,得到两个以上所述单向循环列表。
进一步地,所述S2具体为:
预设所述编号的初始值,得到当前编号值;
当添加一元素至所述并查集时,设置与所述一元素对应的编号的值为所述当前编号值;
自增所述当前编号值。
进一步地,所述S3具体为:
获取编号为N的元素的父亲节点,得到第一父亲节点;
若所述第一父亲节点不是根节点,则将所述第一父亲节点的编号存储于所述第一向量的第N个存储单元中;否则:
获取所述第一父亲节点所在集合的元素总个数;将所述元素总个数的相反数存储于所述第一向量的第N个存储单元中;
所述N为整数。
进一步地,还包括:
S61、获取一元素,得到第一元素;
S62、在所述元素数据映射表中获取与所述第一元素对应的编号,得到第一编号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811572175.4/2.html,转载请声明来源钻瓜专利网。





