[发明专利]一种面向SSD的基因对比方法及系统有效
申请号: | 201910354585.X | 申请日: | 2019-04-29 |
公开(公告)号: | CN110085284B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王毅;林观泉;陈炜轩;黄江帆;毛睿;廖好;周池 | 申请(专利权)人: | 深圳大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G06F3/06 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 梁岩 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 ssd 基因 对比 方法 系统 | ||
1.一种面向SSD的基因对比方法,其特征在于,所述方法包括:
获取第一DNA片段和第二DNA片段,在SSD中对两个DNA片段进行对齐处理,获取DNA片段的数据,确定N块连续空闲的物理块;所述DNA片段包括第一DNA片段和第二DNA片段;
对于第n个物理块,n的初始值为1,n为小于或等于N的正整数,将DNA片段的数据放入第n个物理块,确认第n个物理块是否被放满,若未被放满则代表数据放置完毕,记录下最后一块物理块页数num_final_page;计算总物理页数num_total_page,将DNAid、N、num_total_page这三个数据形成一个节点放在链表DNAinfo的尾部,若第n个物理块被放满,则令n=n+1,回执行所述将DNA片段的数据放入第n个物理块,确认第n个物理块是否被放满的步骤
从SSD中读取所述两个DNA片段的数据,根据所述两个DNA片段的数据及预设的精度参数确定对比参数,具体包括:
从链表DNAinfo中找到第一DNA片段的节点及第二DNA片段的节点,将第一DNA片段的节点及第二DNA片段的数据读取到内存,并计算第一DNA片段及第二DNA片段的大小dna_a_length、dna_b_length,
比较所述两个DNA片段大小,得到最小值dna_min_length;
确定精度参数scale_1、scale_2、scale_3得到起始比较次数compare_times,以下用C表示,
其中compare_times=dna_min_length*scale_1,
dna_length=num_total_page*每页的大小,
精度参数scale_1、scale_2、scale_3在0-1之间;
基于对比参数,对所述两个DNA片段进行递进式对比,得到对比结果,具体包括:
从[0,dna_min_length]中等概率选出C个位置,dna_min_length为所述两个DNA片段大小的较小值,分别将两个DNA片段上的C个位置上的数据逐一对比,得到相同个数count;
若count<C*scale_2则两个DNA片段相似度低于阈值;
若count≥C*scale_2则将compare_times调整为2倍,若2C≤dna_min_length*scale_3则说明这两个DNA相似度达到阈值;若2C>dna_min_length*scale_3,则回执行所述从[0,dna_min_length]中等概率选出C个位置,dna_min_length为所述两个DNA片段大小的较小值,分别将两个DNA片段上的C个位置上的数据逐一对比,得到相同个数count的步骤。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若结果高于或等于相似度阈值则进行编辑距离计算以得到精确结果;若结果低于相似度阈值则无需进行编辑距离计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910354585.X/1.html,转载请声明来源钻瓜专利网。