[发明专利]基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法有效

专利信息
申请号: 201510590067.X 申请日: 2015-09-16
公开(公告)号: CN105260395B 公开(公告)日: 2018-05-01
发明(设计)人: 刘健;李宝娟;高东怀;许卫中;孙茂;许浩;靳豪杰;张军超 申请(专利权)人: 中国人民解放军第四军医大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 西安通大专利代理有限责任公司61200 代理人: 徐文权
地址: 710032 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法,属于数据存储及处理技术领域。本发明基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法,主要包括两个方面一是基于倒排索引结构的STR数据存储方法,该方法会依据样本所选取STR基因座,建立不同的数据域,在数据域中将STR数据以倒排索引结构存储;二是亲子鉴定排序比对方法,该方法基于划分域的倒排索引结构,计算寻亲样本与数据库中样本的亲缘关系,实现快速、稳定、可靠的在线寻亲。
搜索关键词: 基于 索引 结构 str 数据 存储 亲子鉴定 排序 方法
【主权项】:
基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法,其特征在于,包括以下步骤:1)基于倒排索引结构的STR数据存储首先,将所有STR数据进行预处理,将每个样本的STR数据集整理为标准格式;然后,将每一个位点作为一个数据域,每个数据域中将存储各自的STR数据;最后,将STR数据以倒排索引的方式存储;对STR数据进行预处理,将每个样本的STR数据集整理为标准格式,具体如下:将样本数据集记为X={x1,x2,...,xn};其中,xi表示第i个个体的STR数据,其中,表示第j个STR基因座的名称,vjk表示第k个染色体上基因座j上STR的特征值;2)基于以倒排索引的方式存储的STR数据的亲子鉴定排序比对首先,将待寻亲STR数据进行预处理,将每个样本的STR数据集整理为标准格式;然后,将每个位点的STR数据在各自的数据域中进行比对,并形成最终的亲子关系指数;最后,判定样本之间是否存在亲子关系,如果亲子关系指数高于特定的值,则认为候选样本的供体与待寻亲样本的供体具有亲子关系,反之则认为两者之间不存在亲子关系;其中,将待寻亲STR数据进行预处理,具体如下:将寻亲样本整理为如下格式:y={strj:(vj1/vj2)},其中strj表示第j个STR基因座的名称,vjk表示第k个染色体上基因座j上STR的特征值;所述亲子关系指数的计算如下:对于样本y,遍历strj:(vj1/vj2),如果存在strj对应的域dm,则获得vj1和vj2索引所对应的样本集合,分别记为Xj1和Xj2;取Xj1和Xj2的并集,记为Xj=Xj1∪Xj2;在获得每个strj所对应的Xj后,计算Xj的并集X=X1∪X2∪...∪XJ,X中的每个元素均为候选样本;对X中的每一个元素xi,计算其中:则qi为候选样本xi的亲子关系指数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军第四军医大学,未经中国人民解放军第四军医大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510590067.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top