[发明专利]基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法有效
| 申请号: | 201510590067.X | 申请日: | 2015-09-16 |
| 公开(公告)号: | CN105260395B | 公开(公告)日: | 2018-05-01 |
| 发明(设计)人: | 刘健;李宝娟;高东怀;许卫中;孙茂;许浩;靳豪杰;张军超 | 申请(专利权)人: | 中国人民解放军第四军医大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 徐文权 |
| 地址: | 710032 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法,属于数据存储及处理技术领域。本发明基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法,主要包括两个方面一是基于倒排索引结构的STR数据存储方法,该方法会依据样本所选取STR基因座,建立不同的数据域,在数据域中将STR数据以倒排索引结构存储;二是亲子鉴定排序比对方法,该方法基于划分域的倒排索引结构,计算寻亲样本与数据库中样本的亲缘关系,实现快速、稳定、可靠的在线寻亲。 | ||
| 搜索关键词: | 基于 索引 结构 str 数据 存储 亲子鉴定 排序 方法 | ||
【主权项】:
基于倒排索引结构的STR数据存储及亲子鉴定排序比对方法,其特征在于,包括以下步骤:1)基于倒排索引结构的STR数据存储首先,将所有STR数据进行预处理,将每个样本的STR数据集整理为标准格式;然后,将每一个位点作为一个数据域,每个数据域中将存储各自的STR数据;最后,将STR数据以倒排索引的方式存储;对STR数据进行预处理,将每个样本的STR数据集整理为标准格式,具体如下:将样本数据集记为X={x1,x2,...,xn};其中,xi表示第i个个体的STR数据,其中,表示第j个STR基因座的名称,vjk表示第k个染色体上基因座j上STR的特征值;2)基于以倒排索引的方式存储的STR数据的亲子鉴定排序比对首先,将待寻亲STR数据进行预处理,将每个样本的STR数据集整理为标准格式;然后,将每个位点的STR数据在各自的数据域中进行比对,并形成最终的亲子关系指数;最后,判定样本之间是否存在亲子关系,如果亲子关系指数高于特定的值,则认为候选样本的供体与待寻亲样本的供体具有亲子关系,反之则认为两者之间不存在亲子关系;其中,将待寻亲STR数据进行预处理,具体如下:将寻亲样本整理为如下格式:y={strj:(vj1/vj2)},其中strj表示第j个STR基因座的名称,vjk表示第k个染色体上基因座j上STR的特征值;所述亲子关系指数的计算如下:对于样本y,遍历strj:(vj1/vj2),如果存在strj对应的域dm,则获得vj1和vj2索引所对应的样本集合,分别记为Xj1和Xj2;取Xj1和Xj2的并集,记为Xj=Xj1∪Xj2;在获得每个strj所对应的Xj后,计算Xj的并集X=X1∪X2∪...∪XJ,X中的每个元素均为候选样本;对X中的每一个元素xi,计算其中:则qi为候选样本xi的亲子关系指数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军第四军医大学,未经中国人民解放军第四军医大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510590067.X/,转载请声明来源钻瓜专利网。





