[发明专利]一种基于图数据库实现的家族图谱分析技术有效
| 申请号: | 201910079203.7 | 申请日: | 2019-03-01 |
| 公开(公告)号: | CN110275922B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 张天际 | 申请(专利权)人: | 广州金越软件技术有限公司 |
| 主分类号: | G06F16/26 | 分类号: | G06F16/26 |
| 代理公司: | 北京方政卫士专利代理事务所(普通合伙) 16080 | 代理人: | 黄鑫 |
| 地址: | 510630 广东省广州市天河区五*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据库 实现 家族 图谱 分析 技术 | ||
1.一种基于图数据库实现的家族图谱分析技术,其特征在于:
基于图数据库构建,能够根据不同业务需要,对基础数据使用不同的图论算法进行转换生成各种业务数据;
提供多种家族图谱分析算法,包括遗留算法、多父节点分析法、子女关系逆向分析法、多户主分析法;
与主流大数据平台相整合,充分利用分布式计算能力实现对图数据的分析;实现一套对原始人口数据进行校验的算法,比如身份证号变更、错误过户人员修正,用来对数据进行清洗;
提供RESTAPI接口,能够与既有业务系统进行整合;
在分析人员家庭关系时,采用家族图谱分析算法,首先分析常住人口表,按照户号进行分组,生成一组互相关联的图形,表示一户家庭,每个节点使用身份证号标识,包含必要的属性比如姓名、性别,节点关系通过配偶、父母、监护人以及与户主关系字段生成;
然后进一步分析婚姻登记表,对图中的每一个节点,查找其婚姻登记记录,根据查询结果修改节点关系,或者增加新节点;
最后分析变动信息表,根据每个人员的变动记录中不同的户号将对应节点关联到既有户号中;
在整个分析过程中,如果发现明确的关系,一是继续对图进行转换,二是在查询时再进行计算,只需要找到对应[查找的节点-关系-节点]这样的结构,再对这个子图参照原有逻辑计算;
采用的家族图谱分析算法包括:
·遗留算法
使用本算法的一个典型模式是根据关系人的户主关系,从当前户号家庭中选取对应户主关系的人员,
每一类关系人的分析条件都不能相同,如果相同则说明二者分析可以合并;
若出现分析条件和后续户主关系值相同的情况,这时需要避免重复,因而引入分析标签的概念;
在与户主关系后增加标签名实现;
·多父节点分析法
当且仅当户主只有一个儿子/女儿时,通过分析标签集成到遗留算法中,为此需要额外增加分析标签和字典表:
同一户号下孙子辈的父母监护人字段;
同一户号下儿媳/女婿的配偶字典;
如果兄弟姐妹都结婚,则他们的配偶也无法判断,只有在嫂子或弟媳只有一人的
情况下检查其配偶是否只有一个兄弟姐妹,还要加上户主,加以判断,即一户中的兄弟姐妹组合只有两人,比如:户主是同辈
只有一个嫂子,但有多个弟媳/姐夫/妹夫,选择唯一的是户主哥哥的人,即该家庭只有一个户主的哥哥;
只有一个弟媳,但有多个嫂子/姐夫/妹夫,选择唯一一个是户主弟弟的人,即该家庭只有一个户主的弟弟;
只有一个姐夫,但有多个嫂子/弟媳/妹夫,选择唯一一个是户主姐姐的人,即该家庭只有一个户主的姐姐;
只有一个妹夫,但有多个嫂子/弟媳/姐夫,选择唯一一个是户主妹妹的人,即该家庭只有一个户主的妹妹;
户主是父辈
只有一个女儿=女婿
只有一个儿子=儿媳
·子女关系逆向分析法
针对遗留算法中无法处理多个儿子的儿子的问题,使用子女父母以及监护人信息逆向进行分析,通过子女数据中的父母信息来确定子女关系;
·多户主分析法
在合并常口和变动数据之后,可能出现多个户主的情况,一般是户家庭内部户主变更或者前户主死亡导致;
此类数据的分析方法如下:
1)拆分成多个仅包含一个户主的家庭分组,拆分原则如下:
仅对包含多个户主的分组进行拆分;
户主选择时间序列号更大的数据;
户主状态应有效,即没有死亡;
即便变更为户主的记录在前,也应该选为户主;
若户主选定,则同一身份证号下的其他记录将被拆分出去形成新的分组;
原分组中其他户主也将被拆分到上面新的分组中;
原分组中根据身份证号保留其他户主非户主关系的记录;
保留原分组中非户主记录;
拆分后的记录时间应在当前时间之前,即在当前分组下方,以便后续合并;
若拆分后出现没有户主的情况,则说明当前户号下的成员不是亲属关系;
2)对每一个分组,首先根据与户主关系、身份证号去重,取最新的那一条,同时删除去重后只有一条记录的分组,但也有例外,如果时间最新的那个分组只剩一条记录,需要保留,一般意味着新成员的加入,比如出生申报,另外若单一记录在整个变动历史中只出现过一次,也应保留;
只有一条记录的分组实际上只是其他属性的变更,其与户主关系没有变化,且即便是其他属性变更,也很少涉及到双亲和监护人,因此可以直接删除;
3)合并分组,首先合并无户主分组,一直向上合并,直到加入到包含户主的分组,若仍然存在不含户主的分组,则开始对包含户主的分组进行合并,一直向上吸收不含户主的分组,直到遇到包含户主的分组;
4)利用集合论的包含运算对每一个分组根据与户主关系和身份证号进行去重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州金越软件技术有限公司,未经广州金越软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910079203.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于数据采集的开发平台
- 下一篇:插件化图形的管理方法及设备





