[发明专利]一种错误亲缘关系环深度优先检测方法和装置无效
申请号: | 201310582087.3 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103632042A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 倪龙 | 申请(专利权)人: | 宁波保税区攀峒信息科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 315800 浙江省宁*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 错误 亲缘 关系 深度 优先 检测 方法 装置 | ||
技术领域
本发明属于计算机信息处理领域,尤其涉及一种错误亲缘关系环深度优先检测方法和装置。
背景技术
数据质量问题是影响数据可用性的一个重要因素,在数据质量问题当中,主要有两类问题,一是数据冲突,二是数据错误。数据冲突和数据错误在很多时候存在交叉,一般来说有很多数据冲突是由于错误的数据引起的,比如两个数据分别表示某人有两个不同亲生父亲,显然其中有一个是错误的,但也不全部如此,有些数据冲突是亲缘关系表示的原因造成的,比如说同类的亲缘关系数据只能选其中一个(一般选最优的),比如一个人有两个妻子,但其中必然有一个是不合法的或者是过去式的(前妻),但两个数据本身并没有错。数据冲突只有在有两个亲缘关系数据进行比较时才有,而数据错误可以在两个数据比较时发现错误,也可以在不进行比较时发现错误,还可以通过对多个数据进行综合判断而得出。这里的数据错误就是指形成一个关系环的数据错误,一般要通过对两个以上的多个数据进行综合判断(但在极端情况下也可通过对一个或者两个数据亲缘关系数据进行判断而得出)才能发现的错误,以和数据冲突时很多情形的数据错误及单个数据可以判断等情况相区别。
并不是所有的关系环都是错误亲缘关系环,一个亲生父母子女关系在非通用的表示中,亲生父母的亲缘关系数据通过其亲生子女属性指向亲生子女,而亲生子女的亲缘关系数据通过其亲生父亲或母亲属性指向亲生父亲或母亲,就形成了一个关系环,这是由于亲缘关系的相互性形成的最小的关系环,是正常的。错误亲缘关系环的错误种类与亲缘关系种类(包含多种亲缘关系类别)有关,以血亲关系为例,甲的父亲为乙,乙的父亲为丙,丙的父亲为甲,这就形成了一个错误的亲缘关系环,跨亲缘关系种类的错误亲缘关系环肯定也会存在,但比较复杂这里不考虑,这里只考虑一种亲缘关系种类中的错误亲缘关系环,也可以更短如甲的父亲为甲或甲的父亲为乙及乙的父亲为甲,但这两种情况可以通过其它的错误检测方法检测出来,这里作为两种特例,即关系人自身之间的关系和两个互为自反的关系的特例情况。一个有的亲缘关系类别的亲缘关系数据有可以判断的数据错误,而有的则没有。收养关系中也存在相同的情况,因此要检测错误亲缘关系环,必须根据不同亲缘关系种类分别进行考虑,而目前还没有相关的研究及检测方法和装置。
发明内容
本发明要解决错误亲缘关系环检测的问题,为解决上述问题,本发明的目的在于提供一种错误亲缘关系环检测方法和装置,采用深度优先的算法,使错误亲缘关系环能通过一个及以上(一般是三个及以上的多个)的亲缘关系数据进行综合判断而检测出错误。上述错误亲缘关系环相比正确的关系环有一个最大的特点,就是亲缘关系单向关联,上述几个例子就都是以亲生父亲关系人作为单向关联的条件,所以导致错误的亲缘关系环,而正常的则是双向的关联。其实在单向关联的同时引入平行关系的关联也是能够判断错误亲缘关系环的,甲的父亲为乙,乙的同父兄弟姐妹为丙,丙的父亲为甲,也构成一个错误的关系环。单向关联不限于同样的关系人进行关联,比如前面例子中的父亲关系人,用母亲关系人也可以,如甲的父亲为乙,乙的同父兄弟姐妹为丙,丙的母亲为甲,也构成一个错误的关系环。因此错误亲缘关系环检测的关键在于进行单向关联,单向往上(上一辈的关系人)或者单向往下(下一辈的关系人),平行方向关系人(平辈关系人)均可包含在内不影响整个检测的单向性,以上所有亲缘关系均限于同一亲缘关系种类之中。
为解决上述技术问题,本发明提出的错误亲缘关系环深度优先检测方法,主要包括以下步骤:
第一步,进行初始化,创建一个检测分支栈并将第一个分支入栈成为栈顶分支,设置一个关系长度最高允许值,为栈顶第一个分支创建相应的关系长度计数器并置为零及创建一个为空的关系人集合、一个空的亲缘关系数据集合及一个该亲缘关系数据数据集合当前关联数据是否已处理的状态标记;
第二步,将开始检测的第一个亲缘关系数据放入栈顶第一个分支相应的亲缘关系数据集合,并标记为该集合当前关联数据,然后提取数据中参与亲缘关系的两个关系人,如果不相同则均放入栈顶第一个分支相应的关系人集合并将第一个分支相应的关系长度计数器加1,然后将相应的亲缘关系数据集合当前关联数据是否已处理的状态标记设置为已处理;如果相同则得出检测结果是检测出错误亲缘关系环且出错的数据集合在上述亲缘关系数据集合中,检测过程结束;
第三步,如果栈为空则检测过程结束;如果不为空对于且栈顶分支相应的亲缘关系数据集合当前关联数据是否已处理的状态标记设置为已处理,则按照确定的亲缘关系方向往上或往下(均可包括平行方向)取栈顶分支下一个关联的同种类亲缘关系数据,否则直接执行第五步;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波保税区攀峒信息科技有限公司,未经宁波保税区攀峒信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310582087.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用